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本 书 介绍 了 目前 内 容 分 发 网 络 (CDN) 最 新 的 概念 、 原 理 、 特 
点 、 应 用 、 平 台 、 设 计 思 路 、 建 模 、 仿 真 、 工 程 方法 以 及 最 近 的 技术 
发 展 ， 可 以 帮助 读者 了 解 CDN 的 基本 概念 、 技 术 原 理 及 各 种 模型 。 

全 书 共 分 为 3 个 部 分 。 第 1 部 分 是 CDN 基础 ， 分 为 6 章 ， 主 要 
介绍 CDN 的 基本 思想 、 技 术 和 现状 。 第 2 部 分 是 CDN 建 模 和 性 能 ， 
分 为 4 章 。 第 3 部 分 是 高 级 CDN 平台 和 应 用 ， 分 为 6 章 。 

本 书 内 容 详尽 、 章 节 顺 序 安排 合理 ， 既 包括 学 术 界 及 业界 的 研究 
成 果 ， 也 不 乏 实 际 案 例 ， 可 以 作为 系统 工程 师 、 相 关 从 业 人 员 、 产 品 
开发 人 员 、 研 究 人 员 以 及 研究 生 的 参考 书籍 。 
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译 者 序 


随 着 信息 技术 的 快速 发 展 ， 互 联网 已 成 为 人 类 信息 社会 的 主要 基础 设施 之 
一 ， 但 互联 网 经 过 半 个 多 世纪 的 发 展 ， 已 经 演变 成 为 一 个 复杂 的 巨 系 统 。 随 着 用 
户 规模 快速 增长 ， 资 源 并 发 访问 显著 ,使 得 有 限 的 网 络 资源 与 日 益 增 长 的 用 户 需 
求 之 间 的 矛盾 日 益 突出 。 此 外 ， 各 种 新 型 应 用 和 智能 终端 的 出 现 ， 种 类 繁多 的 业 
务 形态 访问 异 质 异 构 资 源 时 ， 服 务 质量 要 求 差 异 较 大 ， 传统 的 内 容 传递 方法 难以 
满足 要 求 。 再 者 ， 网 络 流量 视频 化 的 趋势 ， 需 要 通过 新 的 网 络 体系 架构 解决 海量 
数据 的 应 用 问题 。 这 些 均 使 得 内 容 分 发 面临 重大 挑战 。 

内 容 分 发 网 络 (CDN) 的 思想 产生 于 1998 年 ， 该 技术 通过 内 容 复制 和 用 户 
就 近 访 问 的 方式 ， 试 图 缓解 困扰 着 互联 网 内 容 提供 商 的 瓶颈 难题 。 经 过 多 年 的 实 
践 化 探索 ，CDN 技术 逐渐 受到 广泛 关注 并 得 到 了 快速 的 发 展 ， 其 提供 的 分 发 服务 
已 成 为 互联 网 中 一 项 重要 的 组 成 部 分 ， 也 有 相关 研究 表明 ， 通 过 对 CDN 的 体系 
结构 进行 改进 ， 性 能 进行 优化 ， 能 够 和 现 有 的 内 容 中 心 网 络 (CCN) 的 功能 相 媲 
美 ， 即 可 以 从 CDN 向 未 来 网 络 进行 演进 。 

同时 ， 国 外 CDN 的 发 展 极为 迅猛 ， 已 出 现 了 如 Akamai, Level3, Limelight 等 
互联 网 知名 大 公司 ， 且 都 有 自己 先进 的 产品 和 服务 。 国 内 也 出 现 了 蓝 汛 、 世 纪 互 
联 、 网 宿 等 相关 企业 ， 但 市 场 点 有 量 和 国外 大 公司 相 比 ， 还 有 一 定 差距 。 同 时 ， 
为 了 更 好 地 提供 服务 ， 原 有 的 内 容 服务 提供 商 ， 诸 如 腾讯 等 ， 也 开始 自 建 CDN。 
网 络 服务 提供 商 也 都 想 通 过 自 有 CDN 占据 网 络 流量 的 霸主 地 位 。 因 此 CDN 竞争 
日 趋 激烈 。 

目前 ， 国 内 在 CDN 技术 方面 的 参考 书籍 较为 匮乏 ， 难 以 满足 广大 从 业 人 员 
的 需要 。 且 本 书包 括 CDN 技术 的 概念 、 原 理 、 性 能 分 析 、 应 用 以 及 实验 数据 ， 
凝聚 着 大 量 CDN 研究 者 、 开 发 人 员 、 设 计 人 员 和 行业 人 员 的 智慧 和 经 验 ， 章 节 
脉络 清晰 、 内 容 翔实 ， 希 望 通过 本 书 的 引入 ,能够 对 从 事 该 领域 研究 和 开发 的 科 
研 和 工程 技术 人 员 带 来 帮助 。 基 于 此 ， 我 们 组 织 了 相关 人 员 对 本 书 进行 翻译 。 

本 书 由 中 央 民 族 大 学 的 宋 伟 、 中 国 兵 器 工业 集团 的 韩 立 伟 、 中 央 民 族 大 学 的 
杨 莉 薄 和 郑 豁 进行 翻译 。 翻 译 工作 的 分 工 如 下 : Xf (1~3 章 ，12 ~13 €), # 
立 伟 (4-7 €), MAH (8 ~11 €), HE (14 ~16 章 ) ， 宋 伟 对 全 书 各 部 分 做 
了 校订 和 修改 。 在 本 书 的 翻译 过 程 中 ， 力 求 既 忠于 原文 ， 又 适 于 国内 从 业 人 员 阅 
读 。 由 于 译 者 知识 水 平和 认识 的 局 限 ， 难 免 在 内 容 和 术语 的 翻译 上 存在 不 妥 之 
处 ， 真 诚 地 欢迎 专家 和 读者 不 吝 指正 ， 以 完善 我 们 的 工作 。 同 时 感谢 傅 思 录 在 本 
书 翻译 过 程 中 给 予 的 帮助 ， 并 感谢 出 版 社 的 张 俊 红 、 朱 林 等 编辑 在 本 书 出 版 中 付 
出 的 大 量 辛 勤劳 动 。 
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原 书 前 言 


作为 一 种 无 处 不 在 的 提供 内 容 分 享 和 服务 的 媒介 ，Web 网 页 的 出 现 造就 了 互 
联网 的 快速 发 展 。 同 时 ， 访 问 Web 内 容 和 服务 的 用 户 数 也 呈 指 数 增长 ， 这 就 对 提 
供 内 容 和 应 用 服务 的 Web 系统 以 及 互联 网 带宽 提出 了 很 高 的 要 求 ， 从 而 造成 了 许 
多 网 站 无 法 满足 这 种 要 求 ， 在 提供 及 时 的 服务 方面 存在 困难 。 

内 容 分 发 网 络 (CDN) 的 出 现 使 这 些 问题 得 以 解决 ， 它 以 可 扩展 方式 提供 网 
络 设施 和 运行 机 制 ， 可 以 更 高 效 地 实现 内 容 和 服务 的 分 发 ， 增 强 了 用 户 的 网 络 体 
验 。CDN 已 经 在 许多 领域 得 到 了 广泛 应 用 ， 如 学 术 机 构 、 广 告 媒体 和 互联 网 广告 
公司 、 数 据 中 心 、 互 联网 服务 提供 商 (JISP)、 在 线 音 乐 零 售 商 、 移 动 电话 运营 
商 、 消 费 电 子 制造 商 以 及 其 他 的 运营 商 等 。 随 着 CDN 概念 的 扩展 、 成 型 和 巩固 ， 
新 形式 的 互联 网 内 容 和 服务 也 随 之 不 断 涌现 ， 为 内 容 的 分 发 和 管理 带 来 了 新 的 挑 
战 ， 同 时 也 为 CDN 的 构建 、 设 计 和 实现 带 来 了 新 的 课题 。 因 此 ， 有 必要 对 这 个 
领域 的 技术 发 展 趋势 进行 研究 ， 从 而 为 CDN 的 相关 研究 人 员 提 供 正确 的 研究 路 
线 图 。 

本 书 名 为 《内 容 分 发 网 络 》,， 将 CDN 最 新 的 研究 成 果 呈 现 给 读者 ， 包 括 概 
念 、 原 理 、 特 点 、 应 用 、 平 台 、 设 计 思 路 、 建 模 、 仿 真 、 工 程 方法 以 及 近期 的 技 
术 发 展 。 本 书 内 容 讲 括 了 学 术 界 及 业界 的 研发 成 果 ， 并 对 世界 各 地 许多 不 同 机 构 
的 实际 案例 进行 了 研究 。 同 时 ， 本 书 还 为 读者 指出 了 未 来 有 潜力 的 研究 方向 以 及 
推动 进一步 创新 的 技术 。 作 者 希望 本 书 能 够 成 为 一 本 有 价值 的 参考 书 ， 为 系统 工 
程 师 、 相 关 从 业 人 员 、 产 品 开 发 人 员 、 研 究 人 员 以 及 研究 生 等 在 内 的 广大 读者 带 
来 帮助 。 

本 书 的 概述 和 范围 : 本 书 将 帮助 读者 理解 CDN 的 基本 概念 ， 了 解 其 基本 技 
术 ， 总 结 有 关 的 概念 、 观 点 、 原 理 以 及 应 用 于 CON 领域 中 的 诸多 模型 。 因 此 ， 
本 书 对 内 容 的 顺序 进行 了 适当 的 编排 ， 分 别 从 以 下 几 个 方面 对 CDN 进行 了 介绍 ， 
包括 基本 概念 、 设 计 过 程 、 实 践 、 技 术 、 性 能 、 平 台 、 应 用 以 及 实验 结果 。 同 
时 ， 本 书 对 与 CDN 相关 的 基本 方法 、 创 新 性 内 容 、 重 要 研究 成 果 以 及 进一步 研 
究 所 用 到 的 参考 文献 也 都 有 所 介绍 ， 并 在 相应 的 章节 对 不 同 的 设计 和 开发 方法 给 
出 了 比较 ,使 新 进入 该 领域 的 研究 人 员 和 资深 研究 人 员 都 可 以 使 用 该 评估 结果 作 
为 研究 的 路 线 图 。 本 书 的 所 有 内 容 都 经 过 了 审核 、 编 辑 和 处 理 ， 并 进行 了 适当 的 
编排 以 保证 其 连贯 性 。 这 样 ， 无 论 读者 对 CDN 的 了 解 和 技术 水 平 如 何 ， 都 可 以 
从 本 书 中 获得 最 大 的 收获 。 全 书 分 为 3 部 分 : 第 1 部 分 是 CDN 基础 ， 第 2 部 分 是 
CDN 建 模 和 性 能 ， 第 3 部 分 是 高 级 CDN 平台 和 应 用 。 这 种 内 容 安排 保证 了 每 个 
后 续 章节 都 是 建立 在 之 前 章节 的 基础 上 ， 使 内 容 之 间 实 现 了 平滑 的 衔接 。 本 书 的 
主要 内 容 如 下 : 
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CDN 基础 知识 和 现状 ; 

CDN 技术 分 类 ; 

高 效 、 动 态 和 可 扩展 的 内 容 复制 技术 ; 

内 容 分 发 和 管理 ; 

利用 缓存 进行 复制 的 综合 应 用 及 其 性 能 ; 
对 动态 内 容 请 求 的 重 定向 ; 
利用 经 济 学 原理 进行 CDN 建 模 ; 

定价 策略 与 CDN 商业 模型 ; 

资源 分 配 与 管理 的 数学 建 模 ; 

CDN 性 能 ; 

CDN 互联 方案 、 架 构 和 方法 ; 

流 媒 体 ; 

动态 CDN 和 基于 QoS 的 自 适 应 内 容 分 发 ; 
移动 的 动态 CDN; 

应 用 : 实时 与 按 需 视频 服务 、 社 区 网 络 的 内 容 分 发 。 

第 1 部 分 主要 介绍 CDN 的 基本 思想 、 技 术 和 现状 。 在 第 1 HB, Pathan 等 人 介 
AI CDN 及 其 起 源 、 发 展 和 现状 。 该 章 定义 了 CDN 及 相关 术语 ， 对 CDN 进行 了 
深入 的 介绍 ， 并 通过 与 相关 的 分 布 式 计算 模型 的 比较 ， 总 结 了 CDN 的 特点 ， 进 
而 提出 了 CDN 领域 未 来 技术 的 发 展 方向 。 目 前 已 有 大 量 文献 对 CDN 的 不 同 领域 
进行 了 研究 ， 包 括 内 容 分 发 、 复 制 、 缓 存 以 及 Web 服务 器 放置 等 。 因 此 ， 在 第 2 
Æ Pathan 和 Buyya 提出 了 一 个 综合 性 的 CDN 分 类 方法 ， 禾 盖 了 包括 应 用 、 特 性 
和 实现 技术 等 在 内 的 各 个 方面 。 在 第 3 章 ，Chen 着 重 研 究 了 CDN 对 高 效 、 动 态 
和 可 扩展 复制 技术 的 需求 。 针 对 该 主题 ， 作 者 介绍 了 在 服务 质量 (QoS) 和 服务 
器 的 容量 等 约束 条 件 下 的 动态 和 自 组 织 的 副本 放置 算法 。 在 第 4 章 ，Cardelllini 
等 人 主要 研究 了 使 用 CDN 进行 内 容 分 发 的 相关 问题 ， 其 中 重点 介绍 了 对 动态 创 
建 的 个 性 化 内 容 的 分 发 。 为 了 对 各 种 缓存 策略 以 及 缓存 和 复制 的 综合 应 用 进行 分 
析 和 建 模 ，Stamos 等 人 在 第 5 章 中 介绍 了 相关 的 设计 方法 ， 并 分 享 了 实现 经 验 ， 
内 容 涉 及 在 CDN 仿真 过 程 中 的 各 种 Web 缓存 问题 。 在 第 6 章 中 ，Ranjan 介绍 了 
CDN 中 的 请 求 重 定向 技术 ， 同 时 也 介绍 了 一 种 称 为 WARD 技术 的 概念 验证 性 实 
现 ， 用 来 帮助 实现 动态 内 容 的 重 定向 。 

本 书 的 第 2 部 分 主要 介绍 CDN 的 经 济 学 与 数学 建 模 及 其 性 能 。 在 博弈 论 的 
基础 上 ，Christin 等 人 在 第 7 章 为 参与 CDN 覆盖 网 的 代理 提出 了 一 个 基于 成 本 的 
模型 ， 并 分 析 了 在 CDN 中 建立 连接 的 激励 因素 。 在 第 8 章 中 ，Hosanagar 讨论 了 
内 容 分 发 市 场 的 经 济 分 析 ， 提 供 了 一 个 从 CDN 服务 中 捕获 内 容 提供 商 收益 的 模 
型 ， 并 利用 该 模型 讨论 了 定价 策略 。 针 对 CDN 领域 中 的 资源 管理 和 分 配 问 题 ， 
Bektaş 和 Ouveysi 在 第 9 章 中 展示 了 如 何 利用 数学 模型 进行 系统 分 析 。Sitaraman 等 人 
在 第 10 章 中 介绍 了 Akamai 的 全 局 祯 盖 路 由 及 其 性 能 和 可 用 性 收益 。 
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本 书 的 第 3 部 分 主要 介绍 高 级 CDN 平台 及 其 极 具 吸 引力 的 应 用 。Yoshida 在 第 11 
章 介 绍 了 FCAN， 这 是 一 种 动态 CDN， 主 要 用 来 缓解 瞬时 拥塞 现象 。Fortino 等 人 在 第 
12 章 介绍 了 一 种 基于 CDN 的 支持 协作 播放 服务 的 架构 ， 并 介绍 了 分 级 协作 控制 协议 
(HCOCOP), ， 该 协议 主要 用 于 在 协作 播放 会 话 中 的 流 媒 体 共 享 控制 。 在 第 13 章 ， 
Czymek 等 人 使 用 iTVP 来 解决 多 媒体 CDN 设计 中 面临 的 关键 问题 ，iTVP 是 一 种 基于 
IP 的 、 可 以 实现 在 国家 级 地 域 尺 度 上 向 大 量 在 线 用 户 分 发 多 媒体 内 容 的 平台 。 在 第 
14 章 ，Loulloudes 等 人 介绍 了 移动 CDN 的 信息 发 布 技术 以 及 相关 的 挑战 和 现状 。 在 第 
15 €, Plagemann 等 人 讨论 了 如 何 构建 基于 CDN 的 社区 网 络 设施 。 在 本 书 的 最 后 一 
章 ，Pathan 等 人 介绍 了 CDN 之 间 的 不 同 互联 模型 ， 并 指出 了 这 些 模型 在 实现 中 面临 
的 挑战 。 
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11 引言 


十 几 年 来 ， 网 络 用 户 见证 了 互联 网 的 迅猛 发 展 和 成 熟 ， 宽 带 接 人 量 的 增长 ， 系 统 
复杂 性 的 增加 以 及 内 容 的 日 益 丰 富 ， 使 得 网 络 流量 呈 指 数 级 增长 。 这 也 给 网 络 内 容 的 
优化 管理 和 快速 分 发 带 来 了 新 的 挑战 。 例 如 ， 流 行 的 Web 服务 由 于 大 量 请 求 而 导致 
拥塞 和 瓶颈 问题 的 发 生 。 如 美国 9 11 事件 发 生 后 ， 对 该 事件 相关 内 容 突 发 请 求 ， 产 
生 了 flash crowd'"*), BY Slashdot 效应 ""! ， 从 而 使 相关 服务 器 发 生 严 重 过 载 ， 导 致 “ 热 
点 ”产生 5 。 这 些 突 发 性 现象 很 可 能 会 使 该 网 站 的 服务 器 不 堪 重 负 ， 最 终 因 无 法 承 
受 流量 的 暴涨 而 导致 服务 器 瘫痪 ， 用户 也 会 暂时 无 法 获取 网 站 的 相关 内 容 。 

内 容 分 发 网 络 (CDN)'“' ”中 是 一 个 新 型 的 网 络 体系 架 构 ， 通 过 若干 互联 网 
资源 的 相互 协作 ， 搭 建 互联 网 的 覆盖 网 络 ， 数 据 内 容 在 若干 镜像 Web 服务 器 上 进行 
复制 ， 目 的 是 将 内 容 以 透明 和 高 效 的 方式 传递 给 终端 用 户 。 内 容 分 发 网 络 中 分 布 式 组 
件 之 间 的 合作 在 同 构 性 节点 和 异 构 性 节点 上 都 可 以 进行 。 通 过 CDN， 用 户 访问 Web 
内 容 时 感知 的 服务 质量 (QoS) 将 得 到 解决 。CDN 通过 最 大 化 带宽 使 用 率 、 提 高 成 功 
访问 率 、 维 护 正确 无 误 的 内 容 复制 ， 从 而 提升 服务 质量 。 下 面 将 简要 介绍 内 容 分 发 网 
的 基本 功能 : 

(1) 请 求 重 定向 和 内 容 分 发 服务 

将 用 户 请 求 重 定向 到 最 邻近 和 最 合适 的 CDN 缓存 服务 器 处 ， 从 而 绕 过 堵塞 的 网 
络 节点 ， 解 决 flash crowd 和 Slashdot 效应 。 

(2) 内 容 外 包 与 分 发 服务 

将 内 容 从 源 服务 器 复制 和 (或 ) 缓存 到 分 布 式 的 Web 服务 器 。 

(3) 内 容 协商 服务 

满足 不 同 个 体 用 户 或 群体 的 特定 需求 。 

(4) 管理 服务 

通过 管理 不 同 的 网 络 组 件 来 实现 记 账 ， 并 监测 和 报告 内 容 的 使 用 情况 。 

CDN 主要 的 应 用 领域 有 公共 网 络 、 企 业 网 络 和 边缘 服务 。 由 于 CDN 是 一 个 快速 
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发 展 的 研究 领域 ， 不 断 出 现 新 的 研究 和 创新 ， 这 就 使 本 章 无 法 对 该 技术 进行 面面俱到 
的 介绍 。 因 此 ， 本 章 仅 仅 是 对 CDN 的 发 展现 状 做 一 个 概述 。 但 有 关 CDN 核心 技术 和 
原理 的 介绍 ， 将 对 读者 理解 CDN 技术 起 到 积极 和 重要 的 作用 。 

本 章 余下 内 容 组 织 如 下 : 首先 简要 介绍 内 容 分 发 网 络 ， 随 后 描述 CDN RRNA 
景 ， 并 通过 与 其 他 分 发 式 计 算 方 法 之 间 的 比较 来 突出 CDN 的 独特 性 。 在 1.4 节 ， 介 
AT CDN 的 商业 技术 指标 ，1. 5 节 描 述 了 CDN 的 发 展现 状 ，1.7 节 会 提出 未 来 内 容 
分 发 网 技术 的 发 展 方向 及 研究 路 线 图 ，1. 8 节 进 行 全 章 的 总 结 。 


1.2 概览 


图 1.1 显示 了 一 个 CDN 的 模型 。 其 中 CDN 的 边缘 分 布 着 拓展 到 全 球 的 Web 服务 
器 集群 ， 端 用 户 与 集群 相连 。CDN 将 内 容 传 输 给 这 些 Web 服务 器 集群 ， 并 进行 全 球 
范围 上 的 发 布 ， 从 而 将 内 容 快 速 、 有 效 和 可 靠 地 传递 给 端 用 户 。 内 容 的 复制 将 内 容 推 
送 到 分 布 式 Web 服务 器 ， 既 可 以 是 按照 用 户 的 请 求 需 求 完成 的 ， 也 可 以 是 预先 复制 
的 。 因 此 ， 用 户 在 不 需 了 解 这 些 细节 的 情况 下 ， 通 过 与 其 最 近 的 副本 CDN 服务 器 进 
行 通信 ， 获 取 相关 数据 。 





图 1.1 一 个 CDN 模型 


1.2.1 术语 解释 


在 CDN 的 语 境 下 ， 内 容 分 发 描述 的 是 一 种 为 满足 终端 用 户 请 求 而 做 出 的 内 容 服 
务 行为 。 这 里 的 内 容 可 以 是 指 任何 数据 资源 ， 包 括 两 大 部 分 : 编码 媒体 数据 和 元 数 
据 。 编 码 媒体 包括 静态 、 动 态 和 流 媒 体 数 据 (如 音频 、 视 频 、 文 档 、 图 片 和 网 
页 )。 元 数据 是 对 内 容 的 描述 ， 用 于 多 媒体 数据 的 标识 、 发 现 以 及 管理 内 容 的 统称 ， 
并 有 助 于 对 多 媒体 数据 的 解释 。 内 容 既 可 以 预先 录制 ， 也 可 以 在 直播 过 程 中 提取 ， 既 
可 以 是 长 期 保存 的 数据 ， 也 可 以 是 系统 短期 存放 的 数据 ”。CDN 可 以 被 看 做 是 开放 
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系统 互联 (OS) 网 络 参考 模型 ”的 一 种 新 型 虚拟 覆盖 网 络 ， 它 提供 了 基于 应 用 层 协 
议 (如 超 文 本 传输 协议 (HTTIP) 和 供 实时 传输 流 协议 (RTSP)) 的 覆盖 网 络 
服务 “1。 

CDN 系统 包括 三 个 实体 : 内 容 提 供 商 、CDN 提供 商 和 终端 用 户 。 内 容 提供 商 或 
客户 (customer) 是 拥有 相关 Web 的 URL 且 需 要 进行 相关 内 容 分 发 的 实体 ， 其 源 服 
务 器 上 保存 着 大 量 需 要 分 发 的 内 容 。CDN 提供 商 是 一 个 专 有 的 组 织 或 公司 ， 它 们 向 
内 容 提 供 商 提供 网 络 基础 设施 ， 以 达到 内 容 的 有 效 实时 传输 。 终 端 用 户 或 客户 端 
(client) 是 通过 各 个 内 容 提供 商 的 站 点 访问 内 容 的 用 户 。 

CDN 提供 商 通 过 位 于 不 同 地 域 的 缓存 和 (或) 副本 服务 器 来 复制 内 容 。CDN 组 
存 服务 器 通常 也 被 称 为 边缘 服务 器 或 代理 缓存 服务 器 (surrogate), CDN 的 边缘 服务 
器 被 统称 为 一 个 Web RH. CDN 通过 让 不 同 的 边缘 服务 器 共享 的 内 容 和 URL. 来 发 布 
内 容 。 用 户 的 请 求 被 重 定向 到 与 其 距离 最 近 的 边缘 服务 器 ， 并 由 该 服务 器 按 需 将 相关 
内 容 发 送 至 端 用 户 ， 此 过 程 对 端 用 户 是 透明 的 。 此 外 ， 边 缘 服 务 器 将 所 分 发 内 容 的 记 
账 信息 传输 到 CDN 的 记 账 系统 ， 以 达到 流量 报告 和 计 费 的 目的 。 


1.2.2 CDN 组 件 
图 1. 2 展示 了 CDN 系统 的 总 体 架构 ， 主 要 包含 四 大 组 件 。 
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图 1.2 一 个 CDN 的 架构 组 件 
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(1) 内 容 分 发 组 件 

内 容 分 发 组 件 包 括 源 服务 器 和 一 系列 副本 服务 器 ， 通 过 它们 把 内 容 的 副本 分 发 给 
端 用 户 。 

(2) 路 由 请 求 组 件 

路 由 请 求 组 件 负 责 将 用 户 的 请 求 分 发 给 相应 的 边缘 服务 器 ， 并 与 内 容 分 发 组 件 交 
互 ， 以 及 时 更 新 CDN 缓存 中 存储 的 内 容 。 

(3) 发 布 组 件 

发 布 组 件 把 内 容 从 源 服 务 器 传送 到 CDN 边缘 服务 器 ， 并 保证 缓存 中 内 容 的 一 致 性 。 

(4) 记 账 组 件 

记 账 组 件 保存 用 户 的 注册 记录 和 CDN 服务 器 的 使 用 记录 。 这 些 信 息 可 以 被 内 容 
提供 商 自 身 或 第 三 方 的 收费 组 织 用 于 流量 报告 和 与 使 用 量 挂钩 的 收费 系统 。 

CDN 的 重点 在 于 搭建 自身 的 网 络 基础 设施 ， 以 提供 如 下 服务 和 功能 : 存储 和 管 
理 内 容 、 由 边缘 服务 器 分 发 内 容 、 缓 存 管理 以 及 静态 、 动 态 和 流 媒 体内 容 的 分 发 、 数 
据 备份 、 监 控 、 性 能 测量 以 及 报告 。 

内 容 提供 商 (用户) 可 以 与 CDN 提供 商 签订 服务 协议 ， 在 CDN 缓存 服务 器 上 存 
放 内 容 提 供 商 的 内 容 。 实 际 上 ，CDN 通常 会 对 以 下 第 三 方 内 容 进行 托管 : BAAR 
(如 HTML 页 面 、 图 像 、 文 档 和 软件 包 等 )、 流 媒体 (如 音频 、 实 时 视频 )、 用 户 上 传 
视频 (UGV) 和 其 他 内 容 的 服务 (如 目录 服务 、 电 子 商务 及 文档 传输 服务 ) 等 。 内 
容 的 来 源 包括 大 型 企业 、 网 络 服务 提供 商 、 媒 体 公司 、 新 闻 广 播 等 。CDN 的 典型 用 
户 是 媒体 和 网 络 广告 公司 、 数 据 中 心 、 互 联网 服务 提供 商 (ISP)、 在 线 音乐 零售 商 、 
移动 运营 商 、 消 费 类 电子 产品 制造 商 以 及 其 他 运营 公司 等 。 这 些 用 户 都 希望 能 通过 网 
络 将 需要 发 布 的 内 容 快速 有 效 地 传递 到 终端 用 户 。 终 端 用 户 可 以 通过 手机 、 智 能 电话 
APDA、 手 提 和 台式 计算 机 向 CDN 发 送 内 容 请 求 。 图 1. 3 详细 描绘 了 CDN 提供 商 向 终 
端 用 户 提供 的 不 同 内 容 和 服务 。 





图 1.3 一 个 CDN 提供 的 内 容 / 服 务 


€ 
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CDN 提供 商 根据 终端 服务 器 分 发 的 内 容 (如 流量 ) 来 收取 客户 的 费用 。CDN 具 
备 一 个 专门 的 记 账 系统 ， 可 以 收集 和 记录 用 户 在 路 由 请 求 、 内 容 分 发 和 传输 方面 的 使 
用 信息 ” 。 这 个 系统 实时 记录 CDN 各 个 组 件 的 相关 信息 ， 用 于 统计 、 收 费 以 及 维护 
等 用 途 。CDN 服务 的 平均 收费 标准 是 很 高 的 ” ， 通 常 超出 了 一 般 中 小 型 企业 和 非 盈 
利 组 织 的 承受 能 力 (CDN 定价 机 制 在 走向 平民 化 ) 。CDN 服务 的 价格 主要 是 由 以 下 几 
个 最 重要 的 因素 “决定 : ; 

1) 带宽 使 用 ， 根 据 内 容 提 供 商 统计 的 带宽 使 用 量 (每 兆 比特 ) ， 按 月 向 用 户 收 取 。 

2) 流量 波动 ， 在 一 些 网 络 阻塞 或 不 稳定 状态 〈 如 突 发 性 的 流量 ) 情况 下 ,流量 
的 定价 会 有 所 不 同 。 

3) 边缘 服务 器 上 复制 内 容 的 大 小 ，( 如 每 GB 的 单价 ) 是 一 个 重要 的 定价 衡量 标准 。 

4) 边缘 服务 器 的 数量 ， 为 了 使 收费 不 高 于 通常 意义 下 的 缓存 服务 方式 ，CDN 提 
供 商 在 提供 内 容 服务 时 的 一 个 重要 定价 因素 。 

5) 整个 CDN 系统 的 可 靠 性 与 稳定 性 ， 以 及 内 容 分 发 外 包 的 安全 性 ， 也 制约 了 使 用 共 
享 类 保密 数据 的 价格 ， 这 种 数据 的 服务 价格 根据 保护 内 容 的 类 型 和 内 容 提供 商 而 不 同 。 


1.3 背景 和 相关 系统 


内 容 提供 商 常 把 Web 作为 一 个 向 用 户 提供 传输 丰富 多 媒体 内 容 的 重要 方式 。 但 
是 ， 服 务 质 量 的 下 降 以 及 长 时 间 的 接 人 延 时 (主要 是 由 于 下 载 时 间 过 长 引起 ) ， 会 让 
用 户 放弃 使 用 而 离开 。 一 个 企业 通过 网 络 在 电子 商务 上 获 利 越 多 ， 就 越 希 望 能 通过 改 
善 上 网 用 户 的 体验 来 增加 自身 网 站 的 浏览 量 。 因 此 ， 近 几 年 相关 技术 的 发 展 一 直 在 力 
图 提高 内 容 分 发 的 效率 和 服务 质量 ， 于 是 ， 一 种 支持 该 技术 的 新 型 网 络 架构 一 一 内 容 
分 发 网 络 应 运 而 生 。 


1.3.1 CDN 的 发 展 


许多 内 容 网 络 试图 通过 不 同 的 机 制 来 提高 QoS， 以 解决 性 能 的 瓶颈 。 

1) 早期 的 解决 方法 是 借助 增加 高 速 处 理 器 来 优化 网 络 服务 器 的 硬件 水 平 ， 并 通 
过 提高 存储 空间 或 增加 多 任务 处 理 系统 来 优化 传统 的 网 络 结构 。 然 而 ， 这 种 方法 的 灵 
活性 不 佳 ， 因 为 一 些 细微 之 处 的 优化 可 能 并 不 会 对 整个 系统 的 性 能 提升 起 到 很 大 的 作 
用 ， 有 时 候 甚至 整个 服务 器 系统 都 需要 被 替换 。 

2) 通过 ISP 来 部 署 具有 缓存 功能 的 代理 服务 器 (caching proxy) ， 该 方法 对 窄带 
用 户 访问 网 络 会 很 有 帮助 ， 因 为 它 提 高 了 系统 性 能 并 降低 了 网 络 使 用 率 ， 使 缓存 代理 
服务 器 更 加 贴近 用 户 。 缓 存 代理 服务 器 还 有 可 能 配置 一 些 可 以 探测 到 服务 器 失效 的 技 
术 ， 从 而 使 缓存 资源 的 有 效 性 最 大 化 。 用 户 通常 会 设置 他 们 的 浏览 器 ， 通 过 向 缓存 ， 
而 不 是 直接 向 源 服务 器 来 发 送 Web 请 求 。 当 设置 成 功 后 ， 用 户 的 整体 浏览 过 程 通过 
缓存 代理 服务 器 提供 服务 ， 这 些 缓存 代理 服务 器 上 存储 着 用 户 访问 量 最 高 的 内 容 。 

3) 提供 商 还 可 能 会 为 不 同 地 理 分 布 的 地 区 部 署 不 同 级 别 的 缓存 〈 本 地 级 、 地 区 
级 和 国际 级 ) 。 这 种 方式 属于 分 层 缓存 方法 ， 可 以 进一步 改进 性 能 和 带宽 存储 能 
力 07 。 另 一 种 更 广泛 使 用 的 方法 是 建立 可 扩展 的 服务 器 群 (server farm)。 一 个 服务 
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器 群 由 多 个 Web 服务 器 组 成 ， 每 一 个 服务 器 都 负责 承担 相同 Web 站 点 的 响应 负 
载 中 。 这 使 得 4~7 层 交 换 机 (一 种 依据 URL 请 求 、 内 容 类 型 和 用 户 名 等 信息 工作 
的 智能 交换 ， 而 这 些 信息 都 可 以 在 4~7 E 0SI 协议 栈 请 求 包 里 找到 ) 、 网 页 交换 机 或 
内 容 交换 机 可 以 检查 被 请 求 的 内 容 ， 并 在 各 组 服务 器 之 间 调 度 。 服 务 器 群 由 代理 服务 
器 而 非 交 换 机 构成 ， 这 种 方式 更 加 灵活 ， 可 拓展 性 也 更 强 。 此 外 ， 它 还 有 内 部 纠 
错 能 力 。 随 着 网 站 与 互联 网 之 间 网 络 连接 的 升级 ， 服 务 器 群 可 以 得 到 更 多 的 部 署 。 

4) 尽管 服务 器 群 和 分 层 缓存 法 通过 使 用 缓存 代理 服务 器 可 以 解决 网 络 性 能 问 
题 ， 但 它们 也 有 不 足 之 处 。 首 先 ， 由 于 服务 器 被 部 署 在 源 服务 器 附近 ， 当 网 络 堵塞 时 
它们 对 提高 网 络 性 能 所 起 到 的 作用 就 会 很 小 。 缓 存 代理 服务 器 或 许 在 这 种 情况 下 有 
用 ， 但 它们 是 根据 用 户 需求 进行 缓存 ， 这 可 能 会 迫使 拥有 热点 内 容 的 内 容 提供 商 使 用 
更 大 的 服务 器 群 、 负 载 均 衡 和 高 速 宽带 连接 去 满足 用 户 需 求 。 为 了 解决 这 些 不 足 ， 另 
一 种 内 容 网 络 于 20 世纪 90 年 代 开 发 出 来 ， 被 称 为 内 容 分 发 网 络 (Content Distribution 
Network 或 Content Delivery Network ) ， 这 种 计算 机 网 络 系统 利用 Internet 实现 透明 化 协 
作 ， 将 内 容 传 输 到 终端 用 户 。 

随 着 CDN 的 引入， 内 容 提 供 商 开始 将 他 们 的 网 站 连接 到 CDN。 通 过 CDN 进行 内 
容 服务 后 ， 他 们 就 很 快意 识 到 ， 无 须 维护 那些 昂贵 的 基础 设施 就 可 以 得 到 较 高 的 可 靠 
性 和 可 扩展 性 。 因 此 ， 提 高 CDN 设施 建设 找到 了 充足 的 理由 。Akamai Technolo- 
gies”) HEA MIT 对 瞬时 拥塞 的 研究 成 果 ， 当 时 科学 家 们 开发 出 了 一 系列 突破 性 算 
法 ， 实 现在 由 遍布 全 球 的 服务 器 构成 的 大 型 网 络 上 智能 地 进行 内 容 的 路 由 和 复制 。 在 
近 几 年 里 ， 一 些 企 业 成 为 提供 快速 、 可 靠 内 容 服 务 的 专家 ，CDN 为 行业 带 来 了 许多 
一 利 的 机 会 。 瞬 时 拥塞 问题 ”* (如 美国 9. 11 Se) 会 造成 某 些 网 站 的 严重 组 
存 问题 。 因 为 CDN 可 以 有 效 地 应 对 瞬时 拥塞 问题 ， 许 多 CDN 提供 商 在 基础 设施 建设 
上 加 大 了 投资 力度 。 第 一 代 CDN 主要 将 关注 放 在 静态 和 动态 Web XH; 而 第 二 
代 CDN 开始 着 眼 于 用 户 互 动 性 高 的 视频 点 播 、 新 闻 点 播 以 及 音频 、 视 频 等 流 媒体 。 
同时 ， 新 一 代 CDN 还 可 以 把 内 容 分 发 到 移动 设备 上 。 然 而 ， 新 一 代 CDN 的 研究 大 部 
分 还 处 于 探索 阶段 ， 并 没有 真正 投入 市 场 。 我 们 预计 ， 第 三 代 CDN 将 以 互联 网 社区 
为 基础 ， 也 就 是 说 ， 它 将 基于 互联 网 用 户 群 的 共性 。 更 多 有 关 社 区 型 CDN 的 信息 可 
参见 第 15 章 。 图 1.4 展示 了 CON 的 演化 过 程 以 及 对 未 来 几 年 发 展 方向 的 预测 。 

随 着 CDN 业务 的 发 展 ， 许 多 标准 化 组 织 开始 出 现 ， 以 满足 行业 的 标准 化 需要 。 作 
为 官方 机 构 ， 互 联网 工程 任务 组 (IETF) 已 采取 多 项 措施 ， 如 对 RFC 文件 的 发 
布 1-5) | gk T IETF, HBAS (如 BST, ICAP 论坛 器 、 互 联网 流 媒体 联盟 吕 ) 
也 已 采取 相关 措施 来 研究 分 发 高 宽带 内 容 、 音 频 视 频 等 流 媒体 内 容 以 及 相关 数据 内 容 的 
互联 网 传输 标准 。 从 2002 年 开始 ， 大 型 ISP 开始 自 建 CDN 以 提供 定制 化 服务 。 


1.3.2 相关 系统 


数据 网 格 (data grid) 、 分 布 式 数据 库 和 P2P 网 络 这 三 种 分 布 式 系统 与 CDN 服务 
有 许多 共同 点 。 本 节 将 从 需求 、 功 能 和 特性 三 方面 对 以 上 三 种 系统 进行 描述 。 表 1. 1 
对 CDN 和 以 上 三 种 系统 进行 了 比较 ， 展 现 了 其 各 自 独特 的 性 能 。 
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表 1.1 CDN 和 相关 系统 之 间 的 比较 


特征 数据 网 格 分 布 式 数据 库 P2P 网 络 


分 类 一 组 分 布 在 互联 网 | ”数据 密集 型 计算 | ”分布 在 多 物理 环境 | ”通过 资源 对 等 聚集 而 
上 的 联网 计算 机 集合 | 环境 下 的 数据 逻辑 集合 | 形成 的 信息 检索 网 络 
























| 参与 单位 值 对 象 的 
网 络 边缘 上 的 缓存 | 形成 现 有 数据 库 的 联合 
组 成 | 服务 器 Hs [ (VO) 值 对 | 与 拆 分 ileal 
"T 
通过 预 设置 ， 最 优 
eure | EARRANN | 资源 渤 择 ， 训 速效 所 Pith 对 等 之 间 的 文件 
A Web mint 移动 得 到 数据 分 布 的 共享 


性 能 增益 


集成 
数据 网 格 副本 之 间 | ”多 数据 库 之 间 的 完 
完 完 N/A 
副本 内 容 之 间 缓 存 | ”数据 网 格 副本 之 间 | ”分布 式 数据 库 之 间 | ”缓存 内 容 之 间 弱 一 
的 强 一 致 性 的 弱 一 致 性 强 一 致 性 致 性 


一 臻 性 
自治 性 | | 自治 参与 者 自治 DDB 网 站 | ”自治 对 等 


跨 组 织 和 跨 界 的 数 | 定位 或 缓存 内 容 ， 
业务 活动 | ”内容 缓存 据 无 颖 分 析 、 协 同 与 oo 加 密 、 检 索 解密 ， 并 
维护 验证 内 容 
管理 所 有 权 | 机构 联 合体 单一 授权 实体 自 利 的 端 用 户 /对 等 
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1. 数据 网 格 

数据 网 格 "”' 是 一 种 数据 密集 型 计算 环境 ， 为 不 同 地 点 的 用 户 提供 服务 ， 可 以 
对 存储 在 分 布 式 资料 库 中 的 数据 集 进行 挖掘 、 传 输 和 管理 。 数 据 网 格 提供 两 种 最 基本 
的 服务 : 高 性 能 的 可 靠 数据 传输 机 制 与 可 扩展 的 副本 出 现 和 管理 机 制 *。 数 据 网 格 
由 分 布 在 不 同 地 点 、 通 过 高 速 连接 的 计算 和 存储 资源 构成 ， 主 要 针对 大 型 科研 应 用 ， 
如 Large Hadron Collidor 的 高 能 物理 实验 、 天 文学 项 目 (如 虚拟 观察 站 '”) 和 蛋白 
质 模 拟 (BioGrid™ ) 。 这 些 项 目 均 需 要 对 海量 数据 进行 分 析 和 处 理 。 由 实验 仪器 和 网 
络 传感器 产生 的 数据 存储 在 一 个 主 站 点 ， 通 过 数据 复制 机 制 传送 到 有 相关 需求 的 存储 
站 点 ， 用 户 通过 本 地 副本 目录 来 定位 他 们 所 需要 的 数据 集 。 通 过 相应 的 权限 许可 ， 用 
户 可 通过 本 地 数据 库 下 载 所 请 求 的 数据 ( 如 果 数 据 在 本 地 有 副本 ) ， 否 则 需要 连接 到 
远程 数据 库 进行 下 载 。 数 据 送 入 计算 单元 进行 处 理 ， 结 果 可 送 往 可 视 化 系统 、 共 享 数 
据 库 或 个 人 计算 机 。 因 此 ， 数 据 网 格 通过 系统 和 区 域 之 间 的 无 颖 衔接 ， 为 用 户 提供 了 
一 个 分 析 数 据 、 与 合作 者 共享 结果 以 及 维护 数据 状态 信息 的 环境 。 数 据 网 格 中 的 资源 
通常 是 多 源 的 ， 并 可 能 跨越 多 个 管理 域 。 因 此 ， 数 据 网 格 的 特色 在 于 海量 数据 的 可 视 
化 、 分 布 式 数据 集 之 间 的 共享 、 统 一 的 命名 空间 逻辑 结构 以 及 数据 管理 。 除 此 之 外 ， 
数据 网 格 也 具有 应 用 特性 。 数 据 网 格 的 目标 是 将 现 有 的 分 布 式 资源 进行 整合 ， 通 过 数 
据 共享 和 发 布 获 得 性 能 的 提升 。 机 构 之 间 往 往 在 某 种 共同 利益 的 驱使 下 ， 形 成 一 个 虚 
拟 组 织 来 共享 资源 ， 这 就 构建 了 一 个 数据 网 格 。 与 之 不 同 的 是 ，CDN 的 主要 目的 在 
于 对 数据 进行 缓存 ， 以 加 速 端 用 户 的 访问 。 另 外 ， 所 有 的 商业 CDN 都 是 私营 性 质 的 ， 
它们 由 企业 进行 管理 和 运营 。 | 

2. 分 布 式 数据 库 

分 布 式 数据 库 书 ' 和 是 分 布 在 不 同 物理 位 置 数据 的 一 个 逻辑 组 织 集合 ， 它 可 能 是 
同一 地 点 不 同 计算 机 中 的 数据 ， 也 可 能 是 互联 的 计算 机 网 络 中 分 散 的 数据 。 分 布 式 数 
据 库 中 的 每 一 台 计 算 机 都 是 一 个 节点 ， 每 个 节点 都 可 以 充当 客户 端 、 服 务 器 或 身 兼 二 
职 ， 这 取决 于 所 处 的 环境 。 每 个 站 点 都 有 一 定 的 自主 性 ， 可 以 执行 一 个 本 地 查询 ， 也 
可 参与 执行 一 个 全 局 的 查询 。 分 布 式 数据 库 可 以 由 一 个 分 拆 的 数据 库 组 成 ， 也 可 以 由 
几 个 现 有 的 数据 库 组 合 而 成 。 这 种 系统 的 分 布 性 对 用 户 来 说 是 透明 的 ， 因 为 它 在 与 用 
户 交互 时 表现 为 一 个 单一 的 逻辑 系统 。 分 布 式 系统 内 处 理 的 事务 (transaction) 也 是 
透明 的 ， 每 个 事务 必须 在 多 个 数据 库 之 间 保 持 完整 性 。 分 布 式 数据 库 主 要 服务 于 大 型 
企业 ， 用 来 取代 过 去 的 集中 数据 库 系 统 ， 实 现 现 有 数据 库 之 间 的 互联 ， 当 新 的 组 织 单 
位 加 入 时 增加 新 的 数据 库 。 分 布 式 数据 库 提供 的 应 用 包括 分 布 式 传输 处 理 、 分 布 式 任 
务 优化 和 资源 有 效 管理 。 分 布 式 数据 库 致力 于 整合 已 有 的 多 种 数据 库 ， 以 获得 一 个 统 
一 、 标 准 的 查询 接口 ， 从 而 增强 可 靠 性 和 吞吐 量 。 分 布 式 数据 库 的 内 部 整合 是 由 一 个 
独立 的 组 织 来 完成 。 与 分 布 式 数据 库 相 类 似 ， 整 个 CDN 也 是 由 一 个 独立 的 自治 实体 
来 管理 。 然 而 ，CDN 与 分 布 式 数据 库 的 不 同 在 于 ，CDN 的 缓存 服务 器 并 不 像 分 布 式 
数据 库 那样 有 自治 特性 。 此 外 ，CDN 的 目的 是 内 容 缓存 ， 而 分 布 式 数据 库 主要 用 于 
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查询 、. 优 化 和 管理 。 

3. P2P 网 络 

P2P 网 络 “的 目的 是 对 计算 机 资源 的 直接 共享 ， 而 不 是 借助 于 某 个 中 转 或 管 
理 中 心 。P2P 网 络 本 质 上 是 一 个 信息 检索 网 络 ， 通 过 ad - hoc 将 资源 进行 整合 ， 形 成 
一 个 部 分 的 或 完全 的 非 中 心 化 网 络 系统 。 在 P2P 网 络 系统 内 ， 每 个 成 员 均 是 自治 的 ， 
并 依赖 其 他 对 等 成 员 获取 资源 、 信 息 和 转发 请 求 。 理 想 情 况 下 ，P2P 网 络 不 存在 控制 
中 心 ， 因 此 任何 一 个 任务 通常 都 由 所 有 实体 协同 完成 ， 如 对 其 他 节点 的 搜索 、 对 内 容 
的 定位 和 缓存 、 对 请 求 的 路 由 、 对 内 容 的 加 密 解密 、 检 索 和 验证 等 。 相 比 传统 的 中 心 
化 系统 ，P2P 网 络 系 统 具 有 更 强 的 容错 能 力 和 可 扩展 性 ， 因 为 它们 不 存在 单 点 失效 
(Single Point of Failure) 问题 >。P2P 网 络 的 一 个 成 员 可 以 在 任意 时 间 加 入 或 离开 该 网 
络 。P2P 网 络 更 适合 这 样 的 内 容 提供 商 ， 如 果 它 们 难以 接 人 或 承受 一 般 商 业 化 CDN 
ARH HH. BitTorrent?" P2P 系统 的 一 个 典型 例子 ， 它 是 一 个 非常 流行 的 P2P 文 
件 分 享 应 用 。P2P 文件 共享 网 络 的 目的 在 于 制定 有 效 策略 使 得 能 够 在 一 个 对 等 群体 中 
定位 特定 的 文件 ， 并 在 网 络 不 稳定 的 状态 下 为 这 些 文件 提供 可 靠 的 传输 服务 。 此 外 ， 
还 可 以 管理 由 于 大 量 访问 流行 内 容 带 来 的 突 发 流量 问题 (如 flash crowds), 5j P2P 网 
络 相反 ，CDN 的 主要 目的 是 关注 用 户 的 访问 需求 ， 而 不 侧重 用 户 之 间 分 享 文件 和 内 
容 的 有 效 机 制 。 同 时 ，CDN 与 P2P 网 络 的 另 一 个 不 同 之 处 在 于 ，CDN 对 单位 时 间 里 
加 入 和 离开 的 节点 数 并 不 关心 ， 而 在 P2P 网 络 中 这 个 数字 非常 重要 。 


1.4 对 CDN 的 深入 探究 


从 以 上 的 讨论 可 以 看 出 ，CDN 的 主要 受益 者 是 那些 希望 确保 对 终端 用 户 服务 质 
量 的 内 容 提供 商 。 现 阶段 对 CDN 的 分 析 表 明 ，CDN 侧重 于 以 下 几 种 商业 性 参数 指标 : 
可 扩展 性 、 安 全 性 、 可 靠 性 、 快 速 响应 以 及 性 能 。 

1. 可 扩展 性 

可 扩展 性 指 一 个 系统 为 了 能 够 处 理 更 多 的 数据 、 更 多 的 用 户 和 更 好 的 传输 ， 而 对 
系统 自身 性 能 进行 拓展 的 能 力 。 为 了 进行 全 球 尺度 上 的 扩展 ，CDN 提供 商 需要 投入 
时 间 和 资金 来 构建 额外 的 网 络 连接 和 设施 ， 包 括 提供 资源 动态 地 应 对 瞬时 拥塞 和 流量 
变化 。 当 遇 到 flash crowds BY, CDN 可 充当 流量 的 “ 减 振 器 ”， 通 过 自动 地 按 需 提供 网 
络 容量 ， 以 此 解决 瞬时 拥塞 问题 。 只 有 具备 这 种 能 力 ，CDN 才能 避免 资源 的 过 度 配 
置 ， 并 为 每 个 用 户 都 提供 高 性 能 的 服务 。 

在 目前 CDN 的 商业 架构 中 ， 内 容 提 供 商 付费 给 CDN 提供 商 来 最 大 化 其 提供 内 容 


O AA (Single Point of Failure, SPoF) 又 称 单 点 故障 ， 是 指 一 个 系统 中 的 这 样 一 个 部 件 : 如果 
它 失效 或 停止 运转 ， 将 会 导致 整个 系统 不 能 工作 。 如 电影 《2012》 中 的 那个 齿轮 ， 它 被 卡 住 后 导 臻 整个 舱 
门 无 法 关闭 ， 进 而 使 整个 引擎 无 法 启动 。 一 一 译 者 注 
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带 来 的 影响 。 然 而 ， 对 现 有 CDN 的 趋势 分 析 表 明 ， 应 用 类 型 的 改变 将 会 导致 未 来 
CDN 模式 的 改变 号 ] 。 将 来 ， 内 容 提供 商 和 终端 用 户 还 将 会 付费 来 获取 高 质量 服务 。 
而 在 这 种 状况 下 ， 可 扩展 性 将 是 以 低 成 本 提供 高 质量 内 容 服务 的 关键 所 在 。 

2. 安全 性 

CDN 的 一 个 核心 服务 是 为 保密 数据 和 高 价值 内 容 提 供 安全 的 分 发 方案 。 这 里 
所 说 的 安全 是 相对 于 无 授权 访问 和 修改 而 言 的 内 容 保 护 。 没 有 适当 的 安全 控制 ，CDN 
平台 会 受害 于 网 络 故 障 、 分 布 式 拒 绝 服务 攻击 (DDoS)、 病 毒 以 及 其 他 意 想不到 的 使 
CDN 业务 瘫痪 的 人 侵 。CDN 需要 严格 满足 物理 基础 设施 、 网 络 、 软 件 、 数 据 和 处 理 
过 程 安全 要 求 。 一 旦 CDN 的 安全 标准 合格 ， 则 无 须 昂贵 硬 件 和 专门 部 件 来 保护 内 容 
的 传输 。CDN 提供 商 需 要 应 对 各 种 潜在 的 风险 ， 包 括 DDoS 和 其 他 恶意 活动 。 

3. 可 靠 性 、 快 速 响应 和 性 能 

可 靠 性 是 指 对 服务 可 用 时 段 和 服务 不 可 用 的 条 件 具 有 可 预期 性 ，CDN 提供 商 通 
过 从 多 个 数据 源 传输 特定 内 容 来 提高 用 户 的 访问 质量 。 对 于 CDN 这 类 需要 极 强 容错 
能 力 的 网 络 ， 适 当 的 网 络 负载 均衡 机 制 是 必需 的 所 。 快 速 响应 通常 指 当 遇 到 可 能 出 
现 的 服务 中 断 情 况 时 ， 服 务 器 将 需要 多 长 时 间 才 能 恢复 运转 。CDN 性 能 通常 以 终端 
用 户 所 获得 的 响应 时 间 (如 延迟 ) 来 衡量 。 响 应 时 间 过 慢 是 用 户 关闭 网 页 和 程序 的 
主要 原因 。CDN 的 可 靠 性 和 性 能 是 受到 分 布 式 内 容 地 理 位 置 和 路 由 机 制 ， 以 及 数据 
复制 和 缓存 策略 的 影响 。 因 此 CDN 往往 使 用 缓存 和 流 式 技术 来 提高 媒体 内 容 的 分 发 
ERED, CDN 还 着 重 于 提供 快速 、 高 可 靠 性 的 网 页 服务 ， 以 此 来 强化 CDN 的 可 靠 性 
和 以 用 户 为 中 心 。 


1.5 CDN 的 发 展现 状 


本 节 将 介绍 目前 CDN 领域 的 发 展 水 平 ， 同 时 还 将 描述 目前 CDN 的 不 同 服务 及 相 
关 技术 。 首 先 ， 简单 介绍 存在 于 内 容 分 发 领域 的 商业 CDN (如 Akamai、EdgeStream、 
Limelight Networks 和 Mirror Image) 。 随 后 ,介绍 学 术 CDN (如 CoDeeN、Coral 和 Glob- 
ule) ， 这 有 助 于 读者 了 解 目 前 CDN 技术 的 全 貌 。 


1.5.1 商业 CDN 


绝 大 多 数 正 在 运营 中 的 CDN 是 由 商业 企业 开发 的 ， 这 些 公司 大 多 经 过 多 次 兼并 、 
收购 和 整合 而 成 。 因 此 ， 本 节 只 着 重 研 究 那些 在 很 长 一 段 时 间 内 有 着 稳定 经 营 模式 的 
公司 。 表 1.2 显示 了 四 个 商业 CDN， 并 附 有 简单 介绍 。 目 前 大 多 数 商 业 CDN 的 最 新 
情况 可 以 在 DavisonU? 和 Pathan ' 的 研究 中 找到 。 

表 1.2 现存 商业 CDN 的 汇总 






产品 /解决 方案 (如 果 有 ) 


Edge Platform (处 理 静 
&. HAW RE), Edge 
Control (管理 应 用 ) 网 络 
操作 控制 中 心 (NOCC) 


覆盖 85% 的 市 场 ， 
提供 CDN 服务 ,包括 | 25 000 个 服务 器 、69 个 国 
家 、900 个 网 络 处 理 占 互 
联网 总 流量 的 20% 






Akamai 


www. akamai. com 
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(8) 


名 称 服务 类 型 覆盖 情况 产品 /解决 方案 (MRA) 


提供 视频 流 〈 通 过 用 户 
的 电缆 或 ADSL 调制 解 调 
器 连接 )， 即 使 在 具有 20 
个 跳 的 路 径 上 〈 从 服务 器 
到 端 用 户 ) 也 能 提供 服务 







EdgeStream 


www. edgestream. 


EdgeStream 视频 点 播 和 
IPTV 流 软 件 〈 供 视频 流 
使 用 ) 






在 公共 互联 网 上 提供 中 
断 视频 流 应 用 






com 







Limelight Content — Edge 
(通过 HTTP. 进行 分 布 式 
内 容 分 发 ) ，Limelight Me- 
diaEdge Streaming (通过 
流 式 技术 进行 视频 和 音乐 
的 分 发 )，Limelight Cus- 
tom CDN (用 户 分 布 式 分 
发 解决 方案 ) 


全 球 内 容 缓存 、Extensi- 
ble Rules Engine ( XRE) , 
VoD 及 Live Webcasting 





Limelight Networks 
www. limelightnet 


边缘 服务 器 分 布 在 全 球 
72 个 地 点 


提供 分 布 式 视频 点 播 、 
直播 音乐 、 游 戏 和 下 载 





works. com 


Mirror Image 


Www. mirror 一 


提供 内 容 分 发 、 流 媒 | 边缘 服务 器 分 布 在 22 
体 、Web 计算 和 报表 服务 | 个 国家 





image. com 


商业 CDN 的 私营 性 质 使 我 们 很 难 找到 其 技术 和 商业 策略 方面 的 详细 信息 。 在 这 
个 商业 CDN 的 发 展 状况 调研 里 ， 我 们 提供 了 尽 可 能 详细 的 信息 。 这 里 需要 说 明 的 是 ， 
许多 CDN 的 特定 信息 ， 如 CDN 计 费 、 已 有 用 户 等 ， 都 将 被 忽视 不 所， 因为 它们 很 可 
能 是 随时 间 快 速 变化 的 。 因 此 ， 本 节 提 供 的 信息 主要 是 那些 较为 固定 的 和 最 新 的 发 展 
状况 。 不 过 ， 如 果 读 者 想 了 解 CDN 定价 机 制 , 建议 读者 阅读 本 书 第 8 章 ， 那 里 概述 了 
CDN 服务 的 计 费 策略 。 

1. Akamai 

Akamai" ™! F 1998 年 在 美国 马赛 诸 塞 州 成 立 。 它 由 MIT 的 一 个 针对 瞬时 拥塞 的 
研究 发 展 而 成 。Akamai 是 内 容 分 发 服务 领域 的 领跑 者 ， 在 69 个 国家 的 900 个 网 络 内 
拥有 超过 25000 台 服 务 器 2 。Akamai 的 技术 基于 以 下 事实 ， 即 从 单一 地 点 提供 网 页 
内 容 服务 会 导致 网 站 可 扩展 性 、 可 靠 性 以 及 性 能 的 严重 下 降 。 因 此 ，Akamai 可 以 被 
视 为 一 个 从 位 于 网 络 边缘 的 多 个 缓存 服务 器 进行 服务 的 系统 。Akamai 服务 器 可 以 分 
发 静态 数据 (如 HTML 网 页 、 图 像 、 可 执行 程序 和 PDF 文档 ) 、 动 态 内 容 (如 动画 、 
脚本 和 DHTML) 以 及 流 式 音 视频 。 

Akamai 的 架构 在 处 理 瞬 时 拥塞 问题 时 ， 把 更 多 的 服务 器 分 配给 高 负载 网 站 ， 让 
较 近 的 服务 器 来 服务 用 户 。 系 统 将 用 户 请 求 分 配 到 最 近 的 可 用 服务 器 以 获取 所 需 内 
容 。Akamai 通过 映射 (mapping) 技术 (也 就 是 将 请 求 定向 到 内 容 服务 器 ) ， 即 使 用 
动态 的 具有 容错 能 力 的 DNS 提供 自动 的 网 络 控制 能 力 ， 映 射 系统 根据 被 请 求 的 服务 、 
用 户 位 置 和 网 络 状态 来 解析 主机 名 ， 并 使 用 DNS 实现 网 络 负载 均衡 。Akamai 的 域名 
服务 器 通过 将 请 求 映射 到 相应 的 服务 器 来 将 主机 名 解析 为 IP 地 址 。Akamai 代理 节点 
与 特定 的 边界 路 由 器 进行 对 等 通信 ; 映射 系统 使 用 BGP (Border Gateway Protocol) ^ 


12 内 容 分 发 网 络 








信息 确定 网 络 的 拓扑 结构 。Akamai 的 映射 系统 结合 网 络 的 地 域 信息 以 及 网 络 实时 统 
计数 据 (如 traceroute 数据 ”” ) 来 提供 详细 、 动 态 的 网 络 结构 视图 和 不 同 映射 系统 的 
服务 质量 测量 。 

Akamai 基于 DNS 的 负载 均衡 系统 持续 监控 服务 状态 以 及 服务 右 和 网 络 状况 。 为 
了 监测 整个 系统 的 运转 状况 ，Akamai 使 用 代理 ， 通 过 下 载 网 络 对 象 并 测量 该 过 程 中 
的 出 错 率 以 及 下 载 次 数 来 模拟 终端 用 户 的 行为 。Akamai 利用 这 些 信息 监测 整个 系统 
的 性 能 ， 自 动 检测 并 暂停 存在 问题 的 数据 中 心 和 服务 器 。 每 个 内 容 服务 器 不 断 向 一 个 
监控 应 用 报告 其 负载 状况 ， 该 应 用 将 这 些 数据 进行 汇总 并 向 本 地 DNS 服务 器 报告 。 
然后 ，DNS 服务 器 由 此 来 确定 当 解 析 主 机 名 时 应 该 返回 哪些 TP 地址 (2 到 多 个 ) dn 
果 某 个 服务 器 的 下 载 量 超出 了 一 个 界限 ， 那 么 DNS 服务 器 会 及 时 将 该 服务 器 的 部 分 
工作 分 配给 其 他 服务 器 。 如 果 这 个 服务 器 的 下 载 量 再 次 超出 界限 ， 则 这 个 服务 器 的 
IP 地 址 对 于 用 户 将 不 再 可 用 。 这 样 ， 当 服务 器 的 负载 从 适度 增加 到 较 高 时 ， 服 务 器 
可 以 分 流 部 分 负载 。Akamai 监控 系统 也 会 将 数据 中 心 的 负载 转移 到 顶层 的 DNS， 从 
而 将 流量 从 过 载 的 数据 中 心 处 引 开 。 除 了 负载 均衡 ，Akamai 的 监控 系统 为 每 个 用 户 
和 内 容 服务 器 提供 内 容 服务 的 集中 报告 ， 这 些 信息 对 于 网 络 运营 和 诊断 非常 有 用 。 

Akamai 通过 HTTP 和 HTTPS 传输 静态 和 动态 内 容 。Akamai 内 容 服 务 器 利用 生存 
期 等 特性 (如 使 用 HTTPS 协议 提供 安全 内 容 服务 的 能 力 、 支 持 内 容 替 换 、 编 码 转换 、 
cookie 使 用 等 ) 来 支持 相关 的 静态 内 容 的 分 发 。 基 于 这 些 特 性 ， 边 缘 服务 器 保证 了 内 
容 的 一 致 性 。 另 外 ，Akamai 利用 Edge Side Includes (ESI) “在 边缘 服务 器 上 处 理 动态 
内 容 。 利 用 ESI 可 以 使 内 容 提 供 商 将 其 动态 内 容 分 成 片段 ， 这 些 内 容 片段 都 具有 独立 
的 缓存 能 力 ， 在 Akamai 的 边缘 服务 器 上 可 被 作为 分 散 的 对 象 来 维护 ， 并 根据 终端 用 
户 的 请 求 ， 动 态 地 组 装 呈 现在 动态 网 页 上 。 

Akamai 支持 微软 Window Media, Real 和 苹果 QuickTime 格式 的 流 媒 体 传输 服务 
(实时 媒体 和 媒体 点 播 ) 。 实 时 流 媒体 由 内 容 提供 商 产 生 和 编码 ， 并 发 送 到 一 系列 Ak- 
amai 边缘 服务 器 的 接 入 点 ， 从 而 将 内 容 提供 给 最 终 用 户 。 为 了 避免 所 有 的 单 点 失效 ， 
数据 的 备份 将 被 保存 在 接 入 点 服务 器 。 此 外 ， 接 入 点 服务 器 使 用 信息 分 散 技 术 (in- 
formation dispersal techniques) 通过 多 个 元 余 路 径 将 数据 发 送 到 边缘 服务 器 。 

AX Akamai 和 禾 盖 路 由 的 更 多 信息 (包括 其 性 能 、 可 用 性 、 实 时 流 的 不 同 应 用 
和 IP 加速 等 ) 可 参阅 本 书 第 10 章 内 容 。 

2. EdgeStream 

EdgeStream'” 于 2000 年 在 美国 加 利 福 尼 亚 成 立 。EdgeStream 是 一 个 提供 互联 网 
视频 流 应 用 的 服务 公司 ， 主 要 提供 视频 点 播 和 IPTV 流 软 件 ， 可 以 实现 互联 网 高 码 率 
视频 的 传送 。 它 使 用 HTTP 流 进 行内 容 分 发 。EdgeStream 公司 支持 多 种 不 同 的 视频 压 
缩 格式 以 供 内 容 分 发 使 用 。 该 公司 已 开发 出 一 系列 技术 ， 如 连续 路 由 优化 软件 
(CROS) 、 网 络 拥塞 隧道 穿越 (ICTT) 以 及 实时 性 能 监控 服务 (RPMS) 等 。 这 些 技术 
有 助 于 解决 延 时 、 丢 包 和 网 络 阻塞 等 问题 。 在 消费 电子 设备 、 无 线 手持 终端 、IP 电视 机 
顶 盒 以 及 先进 数字 电视 的 戏 人 式 应 用 中 ， 都 能 够 使 用 EdgeStream 进行 视频 流 服务 。 

EdgeStream 的 平台 包括 客户 端 和 服务 器 软件 两 部 分 。 服 务 器 软件 包括 内 容 管理 和 
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在 线 报告 (CMOR) 服务 器 软件 模块 、EdgeStream 控制 服务 器 软件 模块 、EdgeStream 
数据 库 系 统 模块 以 及 EdgeStream 流 服务 器 模块 。 所 有 服务 器 模块 既 可 以 组 合 在 一 台 服 
务 器 上 运行 ， 也 可 以 单独 运行 。CMOR 模块 负责 管理 账号 、 内 容 和 系统 中 所 有 其 他 服 
Hat. CMOR 也 可 通过 SQL 数据 库 生 成 基于 Web 的 统计 数据 和 事务 处 理 的 实时 报告 。 
控制 模块 提供 必要 的 授权 以 获得 内 容 的 位 置信 息 和 流 式 数据 分 布 管理 以 及 日 志 功 能 。 
数据 库 模 块 负责 维护 涉及 记 账 和 收费 的 日 志 。EdgeStream 使 用 微软 的 SQL 2000 标准 
版 或 企业 版 服务 器 软件 。 流 服务 器 模块 进行 了 负载 均衡 优化 设计 ， 可 在 低 成 本 的 标准 
服务 器 平台 上 运行 。 当 在 双 处 理 器 的 服务 器 上 运行 时 ， 流 的 传输 速度 可 以 超过 
500Mbit/s， 同 时 具备 TB 级 的 存储 能 力 。 

EdgeStream 客户 端 软件 提供 了 对 于 Windows 媒体 播放 器 和 Real Player 的 插件 接 
口 。 同 时 ， 该 软件 也 能 用 于 检测 网 络 连接 的 质量 。PC 客户 端 软件 是 基于 标准 的 Win- 
dows 平台 ， 仅 有 600KB 大 小 。Firmware 客户 端 软件 仅 有 300KB 左右 〈 或 更 小 ) ， 并 可 
EZAZ Windows XP 或 者 Windows CE 上 。 

3. Limelight 网 络 

Limelight 24° 于 2001 年 创建 于 美国 亚利桑那 的 坦 佩 。Limelight 网 络 提供 的 内 
容 分 发 服务 包括 数字 媒体 内 容 的 HTTP/Web 分 发 ， 如 视频 、 音 频 、 游 戏 、 软 件 和 社交 
媒体 等 。 它 将 内 容 发 布 给 媒体 公司 ， 包 括 电视 人 传媒、 音乐、 广播、 新闻、 杂志 、 影 
视 、 视 频 游 戏 和 软件 企业 。 

内 容 提供 商 将 内 容 直 接 上 传 到 Limelight 的 网 络 服务 器 ， 或 上 传 至 自己 的 服务 器 
上 ， 这 些 服务 器 和 Limelight 网 络 互联 。 当 收 到 来 自 端 用 户 的 请 求 时 ，Limelight 将 内 容 
发 送 到 一 台 或 多 台 Web 服务 器 集群 ， 这 些 集群 会 将 内 容 转 发 至 全 球 每 一 个 经 过 预先 
配置 的 服务 器 处 。 然 后 ， 内 容 将 直接 通过 ISP 或 者 通过 合适 的 公 网 发 送 到 端 用 户 。 同 
其 他 商业 CDN 相同 ，Limelight 也 是 用 DNS 重 定向 技术 来 将 用 户 请 求 重新 路 由 至 本 地 
服务 器 集群 处 。 通 过 结合 BGP 反馈 和 自身 的 测量 (如 从 大 量 可 用 位 置 得 到 的 trace 
route 信息 ) ，Limelight 创建 了 详细 的 互联 网 映射 关系 。 

Limelight 网 络 提供 流 媒体 点 播 分 发 服务 时 ， 支 持 Adobe Flash, MP3 音频 、 微 软 
的 Windows Media, Real 以 及 苹果 公司 的 QuickTime 媒体 格式 。Limelight 网 络 的 专 有 软 
件 Limelight ContentEdge 使 用 HTTP 进行 分 布 式 内 容 分 发 ，Limelight MediaEdge 使 用 流 
媒体 技术 进行 分 布 式 视 频 和 音频 内 容 的 发 布 ，Limelight StorageEdge 供用 户 在 Limelight 
的 CDN 架构 内 存储 自己 的 内 容 ， 同 时 Limelight 的 定制 CDN (Custom CDN) 可 提供 定 
制 化 的 分 布 式 分 发 解决 方案 。 需 要 使 用 Limelight 流 技术 服务 的 内 容 提供 商会 使 用 
Limelight User Exchange (LUX) ， 这 是 一 个 基于 Web 的 管理 和 汇报 控制 台 ， 用 于 跟踪 
并 实时 报告 端 用 户 的 行为 。 所 有 软件 汇聚 在 一 起 ， 将 有 助 于 管理 内 容 分 发 系统 。 

4. Mirror Image 

Mirror Image"? F 1999 年 成 立 于 美国 马萨诸塞 州 ， 是 一 个 向 用 户 提供 在 线 内 容 、 
应 用 程序 、 流 媒体 、Web 计算 、 新 闻 报 告 、 交 易 传递 服务 的 提供 商 。Mirror Image 采 
用 集中 式 的 “超市 ”架构 ， 其 中 内 容 被 存放 在 一 个 极 大 的 Web 服务 器 集群 中 ， 集群 
位 于 稠密 用 户 区 的 中 心地 带 。Mirror Image 利用 运行 在 互联 网 之 上 的 一 种 全 局 内 容 接 
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人 点 设施 架构 (CAP) 来 提供 内 容 发 布 平台 ， 主 要 面向 内 容 提供 商 、 服 务 提 供 商 和 各 
种 企业 。 

当 一 个 用 户 通过 Mirror Image 配置 的 站 点 请 求 服务 时 ， 该 请 求 会 被 自动 路 由 到 
CAP 网 络 上 的 一 个 全 局 负载 均衡 器 上 。 该 负载 均衡 器 使 用 DNS 路 由 来 确定 具有 最 快 
响应 时 间 的 CAP 位 置 。 在 选 定 的 CAP 位 置 处 ， 系 统 从 缓存 和 核心 数据 库 中 搜索 被 请 
求 的 内 容 。 如 果 内 容 找到 ， 便 发 往 用 户 ; BU, CAP 网 络 会 自动 将 一 个 重 定向 状态 代 
码 “302” 返 回 到 源 服务 器 ， 由 源 服 务 器 将 内 容 发 往 用 户 处 ，CAP 网 络 同时 也 从 源 服 
务 器 检索 或 “ 拉 取 ”内 容 ， 并 将 其 存储 以 供 下 次 使 用 。 

Mirror Image 提供 内 容 分 发 、 流 媒体 和 Web 计算 方案 ,包括 全 局 内 容 缓 存 方案 ， 
用 于 服务 静态 内 容 时 的 流量 分 流 。 数 字 产 品 下 载 方 案 用 于 管理 存储 和 下 载 内 容 ， 视 频 点 
播 业 务 用 于 内 容 的 流 发 布 。 可 拓展 规则 引擎 (XRE) 给 予 用 户 关于 分 发 过 程 的 控制 权 ， 网 
播 方案 允许 用 户 发 送 一 对 多 的 消息 ， 这 给 培训 、 市 场 和 远程 教育 提供 了 潜在 机 遇 。 


1.5.2 学 术 CDN 


不 同 于 商业 CDN, P2P 技术 的 使 用 在 学 术 CDN 中 较为 普遍 。 因 此 ， 内 容 分 发 遵 
循 去 中 心 化 的 方法 且 请 求 负载 遍布 在 所 有 参与 主机 上 ， 这 就 使 系统 能 够 有 效应 对 节点 
失效 和 突 发 性 的 负载 激增 。 需 要 注意 的 是 ， 基 于 P2P 技术 的 学 术 CDN 仅 对 静态 内 容 
有 效 ， 不 能 处 理 动态 内 容 ， 因 为 动态 内 容 本 质 上 是 不 能 缓存 的 。 

在 本 节 中 ， 给 出 了 三 种 具有 代表 性 的 学 术 CDN Bil CoDeeN, Coral 和 Clobule。 表 
1.3 提供 了 这 些 学 术 CDN 的 简要 资料 。 其 他 两 个 学 术 CDN， 即 FCAN (用 于 缓解 瞬时 
拥塞 的 自 适应 CDN) 和 COMODIN (用 于 协作 媒体 流 服 务 的 流 CDN) ， 将 在 本 书 的 第 
11 章 和 第 12 章 分 别 给 出 介绍 。 

R13 现 有 学 术 CDN 汇总 表 


使 用 C/C++ 实现 ， 
提供 内 容 缓 存 和 | 在 Linux (24/26 内 
核 ) fil MacOS (10.2/ 
10.3) 上 测试 






可 获得 性 






























CoDeeN 一 个 学 术 CDN 测 
试 平台 搭建 在 Plan- 


etLab 上 的 






www. codeen. cs. N/A 







princeton. edu 








使 用 C+ + 实现 ， 
在 Linux, OpenBSD, 
FreeBSD 和 Mac OS X 
上 测试 


没有 官方 发 布 版 
Coral 是 免费 软件 ， 遵 
循 GPLv2 (GNU 通用 
公开 许可 ) 














一 个 免费 P2P 
CDN， 由 PlanetLab 


托管 


Coral 
www. coralcdn. org 


提供 和 流行 度 相 
关 的 内 容 复 制 






Globule 是 开放 源码 
软件 ， 遵 循 BSD 类 授 
权 及 Apache 软件 授权 
(对 于 打包 的 Apache 
HTTP 服务 器 ) 






提供 内 容 的 复制 

Globule 一 个 开源 的 协作 | 和 服务 器 监控 , 并 |C + + 实现 ， 在 
www. globule. org | 式 CDN 重 定向 用 户 请 求 到 |UNIX/Linux 和 Win- 
可 用 副本 服务 器 dows 上 测试 


使 用 PHP 脚本 C/ 
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1. CoDeeN 

CoDeeN “'” 是 一 个 基于 P2P 的 代理 服务 器 系统 ， 由 普林斯顿 大 学 开发 。 它 基于 
HTTP， 目 的 是 使 相关 参与 用 户 在 访问 大 多 数 Web 站 点 时 获得 更 好 的 性 能 。CoDeeN 提 
Bt f Web 内 容 的 缓存 和 HTTP 请 求 的 重 定 向 。CoDeeN 建立 和 运行 在 PlanetLab 之 
上 ”是 一 个 由 一 系列 高 性 能 代理 服务 器 构成 的 网 络 。CoDeeN 代理 服务 器 的 部 署 为 
“开放 式 ”， 能 够 允许 外 部 的 托管 组 织 访问 。 每 一 个 CoDeeN 节点 都 能 作为 正 向 代理 、 
反 向 代理 或 者 重 定向 器 使 用 。CoDeeN 通过 如 下 方式 运行 : (DH P! YE CoDeeN 的 一 个 
宽带 代理 服务 器 上 设置 他 们 自己 的 网 络 缓存 ， 该 代理 服务 器 通常 要 求 距 离 用 户 很 近 ; 
@CoDeeN 的 节点 作为 正 向 代理 服务 器 使 用 ， 试 图 满足 本 地 请 求 。 如 果 出 现 缓存 未 命 
中 的 情况 CoDeeN 节点 上 设置 的 重 定向 器 逻辑 单元 会 判断 请 求 应 该 被 送 往 何 处 。 对 
于 大 多 数 请 求 而 言 ， 重 定向 器 将 结合 请 求 的 本 地 性 、 系 统 负载 、 可 靠 性 和 邻近 性 来 将 
请 求 转发 到 其 他 的 CoDeeN 节点 ， 这 些 节点 将 作为 反 向 代理 服务 器 处 理 请 求 。 如 果 请 
求 仍 无 法 得 到 处 理 ， 则 将 其 转向 源 服务 器 。 

CoDeeN 具有 本 地 监控 能 力 ， 能 够 监控 服务 器 的 基本 资源 情况 ， 如 可 用 文件 描述 
符 / 套 接 字 、CPU 负载 和 DNS 解析 服务 等 。 它 能 够 收集 CoDeeN 的 系统 状态 和 主机 环 
境 ， 这 些 信 息 有 助 于 对 资源 连接 和 外 部 服务 的 可 用 性 做 出 评估 。 为 了 监控 对 等 成 员 的 
可 用 性 和 状态 ， 每 一 个 CoDeeN 节点 都 使 用 两 种 机 制 : 一 个 轻 量 级 的 UDP 心跳 信息 和 
一 个 重量 级 的 HTTP/TCP 层 的 接收 器 “1 。 第 一 种 情况 中 ， 每 一 个 代理 服务 器 每 秒 发 
送 一 个 心跳 报 文 到 网 络 中 的 一 个 对 等 成 员 ， 该 成 员 回 复 (心跳 确认 或 者 ACK) 所 承 
担 的 负载 信息 ， 包 括 对 等 成 员 的 平均 负载 、 系 统 时 间 、 文 件 描述 符 可 用 性 、 代 理 服务 
器 和 节点 的 正常 运行 时 间 、 每 小 时 的 平均 流量 及 DNS 计时 /故障 统计 数据 等 。 通 过 将 
ACK 的 历史 记录 与 它们 所 承载 的 本 地 状态 信息 相关 联 ， 每 一 个 CoDeeN 节点 会 对 其 他 
节点 的 健康 状况 进行 独立 评估 。 在 第 二 种 方法 中 ， 每 一 个 CoDeeN 节点 都 被 赋予 一 个 
成 本 值 ， 用 于 衡量 该 节点 在 规定 时 间 内 无 法 获取 一 个 页 面 时 的 失败 情况 。 每 一 个 对 等 
成 员 未 能 完成 的 页 面 读 取 历 史记 录 都 被 维护 起 来 ， 并 与 UDP 层 的 心跳 报 文 相 结 合 ， 
能 够 有 助 于 判定 某 个 节点 是 否 能 用 于 请 求 重 定向 服务 。 

很 多 项 目 都 与 CoDeeN 紧密 相关 ， 如 CoBlitz (一 个 针对 大 文件 的 基于 Web 的 分 布 
式 系统 ) CoDeploy (一 个 高 效 的 同步 化 工具 ， 用 于 PlanetLab 的 “片段 ”之 间 同 步 )、 
CoDNS (一 个 快速 、 可 靠 的 名 字 查 找 服 务 ) CoTop (一 个 PlanetLab 网 络 中 基于 命令 
行 的 行为 监控 工具 ) 、CoMon (一 个 基于 Web 的 “片段 ”监控 器 ， 用 于 监控 大 多 数 
PlanetLab 网 络 的 节点 ) 和 CoTest (一 个 登录 检测 工具 ) 。 

CoBlitz 是 一 个 运行 在 CoDeeN 之 上 的 重要 应 用 服务 ， 其 实质 是 一 个 文件 传输 服 
务 ， 可 用 于 在 不 需要 对 标准 Web 服务 器 和 用 户 进行 任何 修改 的 前 提 下 分 发 大 文件 
(因为 所 有 分 发 需要 的 支持 都 能 在 CoDeeN 上 得 到 ) 。 在 CoDeeN 上 建立 CoBlitz 的 动机 
之 一 是 为 了 确保 数据 的 长 期 缓存 ， 使 得 即使 当 请 求 失效 之 后 用 户 请 求 的 内 容 仍 可 以 被 
迅速 服务 。CoBlitz 可 以 公开 访问 ， 人 允许 用 户 使 用 源 地 址 “http: //coblitz. codeen. org: 
3125” 登 录 访问 。 一 个 定制 化 的 DNS 域名 解析 服务 器 将 域名 coblitz. codeen. org 解析 
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为 用 户 附 近 的 某 个 PlanetLab 节点 。 为 了 部 署 Coblitz 这 个 基于 HTTP 的 CDN, HEE 
改 CoDeeN， 使 之 能 够 处 理 大 数据 文件 。 这 个 方法 中 包括 了 对 大 数据 文件 的 修改 ， 以 
便 使 其 能 有 效 地 应 用 在 CoDeeN 上 ， 同 时 也 包括 修改 它 的 请 求 路 由 算法 ， 这 样 就 能 处 
理 过 载 情况 下 的 海量 访问 。 在 CoBlitz 中 ,一 个 大 数据 文件 被 认为 是 由 一 组 小 文件 
(或 文件 片段 ) 组 成 ， 能 够 在 CDN 上 存储 并 发 布 。 这 些 片段 是 否 全 部 缓存 ， 部 分 缓存 ， 
或 根本 没有 缓存 ，CoBliz 依然 可 以 正常 工作 ， 如 需要 可 以 从 源 服务 器 拿 到 丢失 的 片段 。 
因此 ， 在 使 用 CoBlitz 传输 大 文件 时 ， 不 必 考 虑 任何 对 等 成 员 上 是 否 存 有 该 文件 。 

2. Coral 

Coral?" & —4- 483888 P2P 内 容 分 发 网 络 ， 由 纽约 大 学 的 “安全 计算 机 系统 ” 研 
究 小 组 在 访问 斯 坦 福 大 学 时 开发 。 它 的 设计 思路 是 对 Web 内 容 作 镜像 服务 ， 为 大 多 
数 用 户 带 来 良好 的 Web 站 点 访问 性 能 。Coral 利用 自愿 加 入 者 的 带宽 来 避免 瞬时 拥 
塞 ， 并 降低 Web 站 点 和 其 他 Web 内 容 提 供 商 的 负载 。Coral CDN REE PlanetLab 之 
上 ， 而 非 第 三 方 的 系统 。 为 了 使 用 CoralCDN, 一 个 内 容 发 布 者 、 终 端 用 户 或 者 其 他 
任何 使 用 者 需要 在 URL 的 主机 名 后 面 加 上 “.nyud.net:8090” 的 后 级 。DNS 重 定向 方 
法 以 透明 的 方式 将 用 户 重 定向 到 附近 的 Coral Web 缓存 。Coral 的 Web 缓存 彼此 合作 ， 
从 附近 的 对 等 成 员 处 传输 数据 ， 借 此 最 小 化 源 服务 器 的 负载 和 降低 用 户 感知 到 的 延 
时 。CoralCDN 建立 在 Coral 的 关键 值 检 索 层 之 上 ， 使 节点 可 以 在 附近 的 节点 上 访问 被 
缓存 的 对 象 ， 无 须 额外 地 检索 更 远 处 的 其 他 节点 。 同 时 ， 它 避免 了 在 检索 设施 中 出 现 
“热点 " ， 甚 至 在 负载 减弱 的 情况 下 也 能 实现 这 一 功能 。 

CoralCDN 主要 由 三 部 分 组 成 : CDUMESX HTTP 代理 服务 器 组 成 的 网 络 ， 用 于 处 理 
用 户 请 求 ; @ 一 组 DNS 域名 解析 (EI “.nyud.net”) 服务 器 系统 ， 用 于 将 用 户 映射 到 
邻近 的 CoralCDN HTTP 代理 服务 器 ; @ 一 组 底层 的 检索 设施 和 集群 机 制 ， 这 是 前 两 个 
部 分 的 基础 。 

Coral 使 用 一 个 检索 摘要 ， 称 为 分 布 式 散 列 哈 希 表 (DSHT) ， 这 是 一 个 分 布 式 哈 
希 表 (DHT) 的 变 体 。DSHT 设计 用 于 存储 软 状态 “Key - Value” 对 的 应 用 ， 其 中 一 
个 关键 字 可 以 对 应 多 个 值 。DSHT 将 “Key - Value” 对 缓存 在 那些 标识 符 接 近 关 键 字 
的 节点 处 ， 作 为 负载 的 反 函 数 。 它 使 用 “ 散 列 的 ”存储 技术 ， 有 利于 路 由 层 和 存储 
层 之 间 的 跨 层 交互 。 

Coral 对 URL 完成 修改 后 ， 针 对 这 些 修改 后 的 URL 的 HTTP 请 求 由 CoralHTTP 代 
理 服务 器 来 处 理 。 为 了 最 小 化 源 服 务 器 的 负载 ， 一 个 Coral HTTP 代理 服务 器 会 尽 可 能 
地 从 其 他 代理 服务 器 处 读 取 页 面 。 每 一 个 代理 服务 器 都 保留 一 份 本 地 缓存 来 响应 实时 
请 求 。 如 果 一 个 CoralHTTP 代理 服务 器 发 现 被 请 求 内 容 存 在 于 一 个 或 多 个 其 他 代理 服 
务 器 ， 则 它 与 这 些 服务 器 之 间 同 时 建立 TCP 连接 ， 并 向 它 能 连接 上 的 第 一 台 代 理 服 
务 器 发 出 一 个 HTTP 请 求 。 一 旦 邻近 的 代理 服务 器 开始 发 送 有 效 内 容 ， 其 他 所 有 已 经 
建立 的 TCP 连接 都 将 被 关闭 。 当 一 个 用 户 从 非 本 地 URL. 处 请 求 内 容 时 ，CoralHTTP 代 
理 服务 器 会 首先 尝试 本 地 进行 副本 缓存 。 如 果 Coral 的 检索 层 无 法 提供 任何 参考 信息 
或 者 没有 一 台 代理 服务 器 能 够 返回 被 请 求 的 内 容 ， 那么 Coral HTTP. 代理 服务 器 就 从 源 
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服务 器 上 直接 读 取 内 容 。 在 面 对 瞬 时 拥塞 时 ， 所 有 的 CoralHTTP 代理 服务 器 都 自发 地 
组 成 一 种 “多 播 树 ”"， 用 于 检索 Web 内 容 。 然 而 ， 代 理 服务 器 并 不 同时 对 源 服务 器 发 
送 检索 请 求 ， 数 据 从 在 源 服务 器 上 读 取 内 容 的 代理 服务 器 处 向 那些 后 到 的 代理 服务 器 
发 送 请 求 数据 。 在 CoralCDN 上 ， 该 方式 考虑 了 联合 乐观 参考 路 由 和 切入 路 由 选择 的 
方法 。 

CoralDNS 服务 器 将 经 过 Coral 化 的 URL 主机 名 解析 成 中 地址， 并 返回 给 CoralHT- 
TP 代理 服务 器 。Coral 的 架构 是 基于 连接 良好 的 计算 机 集群 。 集 群 面向 高 层 的 软件 的 
接口 ， 构 成 了 DNS 重 定 向 机 制 中 的 一 个 重要 部 分 。 为 了 提升 系统 的 本 地 性 ， 当 一 个 
DNS 解析 器 试图 与 邻近 的 CoralDNS 服务 器 通信 时 ，CoralDNS 服务 器 将 一 个 适当 集群 内 
的 代理 服务 器 返回 给 它 ， 以 确保 今后 该 用 户 的 DNS 请 求 都 不 会 离开 这 个 集群 。 一 个 
CoralDNS 服务 器 仅仅 返回 CoralHTTP 代理 服务 器 的 地 址 ， 而 这 些 代理 服务 器 是 最 近 被 验 
证 通过 的 ， 目 的 是 在 响应 DNS 检索 请 求 之 前 同步 检测 代理 服务 器 的 健康 状态 。 

3. Globule 

Globule' 是 一 个 开源 的 协作 式 CDN， 由 阿姆斯特丹 的 Vrije 大 学 开发 。Globule 
的 目的 在 于 允许 Web 内 容 提供 商 能 够 自我 组 织 并 运营 它们 自己 的 广 域 托 管 平台 。 具 
体 而 言 ，Globule 是 一 个 覆盖 网 ， 由 通过 广域网 以 P2P 方式 互联 的 端 用 户 节点 组 成 ， 
其 成 员 提供 各 种 资源 ， 如 存储 空间 、 带 宽 、 处 理 器 等 。 它 提供 了 对 内 容 的 复制 、 对 服 
务 器 的 监控 以 及 将 用 户 请 求 重 定向 到 可 用 的 副本 服务 器 。 

在 Globule 中 ， 一 个 站 点 被 定义 为 一 组 文档 的 集合 ， 属 于 某 个 特定 用 户 〈 站 点 的 
所 有 人 ) ， 而 一 个 服务 器 就 是 连接 到 网 络 上 的 计算 机 中 运行 的 进程 ， 执 行 着 Globule 
软件 的 一 个 实例 。 每 一 个 站 点 都 由 源 服务 器 、 备 份 服务 器 、 副 本 服务 器 和 重 定向 服务 
器 组 成 。 源 服务 器 拥有 该 站 点 的 所 有 文档 ， 并 负责 向 其 他 相连 的 服务 器 分 发 内 容 。 备 
份 服务 器 维护 着 一 个 托管 站 点 内 容 的 即时 更 新 的 完全 副本 。 不 同 于 备份 服务 器 ， 很 多 
副本 服务 器 可 以 被 用 于 托管 站 点 。 备 份 服务 器 仅仅 维护 内 容 副本 ， 而 副本 服务 器 的 目 
的 是 基于 请 求 负载 和 服务 质量 (QoS) 的 需要 来 最 大 化 性 能 。 一 个 副本 服务 器 一 般 由 
不 同 于 源 服务 器 的 另 一 个 用 户 负责 运行 ， 并 且 一 个 副本 服务 器 一 般 负 责 维护 托管 站 点 
的 所 有 内 容 的 部 分 副本 。 可 以 把 副本 服务 器 视 为 一 个 带 缓存 功能 的 代理 服务 器 ， 负 责 
在 本 地 缓存 未 命中 的 情况 下 从 源 服 务 器 取 内 容 。 一 个 重 定向 服务 器 负责 将 用 户 请 求 重 
定向 到 能 够 服务 该 请 求 的 最 优 副本 服务 器 处 。Globule 的 重 定向 器 可 以 使 用 HTTP 和 
DNS 两 种 方式 。 一 个 重 定 向 器 也 能 实现 一 个 用 于 用 户 重 定 向 的 策略 。 默 认 策略 是 根 
据 预计 的 延 时 时 间 ， 将 用 户 重 定向 至 最 近 的 副本 服务 器 。 重 定向 器 也 监控 其 他 服务 器 
的 可 用 性 ， 以 确保 有 效 的 请 求 重 定向 。 根 据 服 务 角色 不 同一 台 服 务 器 可 以 是 源 服务 
器 、 备 份 服务 器 、 副 本 服务 器 和 重 定向 服务 器 中 的 任意 一 种 。 

Globule 将 节点 间 延 时 作为 副本 服务 器 与 用 户 之 间 邻 近 度 的 度量 。 这 种 度量 用 于 
将 副本 服务 器 最 优 地 部 署 在 用 户 附近 ， 并 将 用 户 请 求 重 定 向 到 合适 的 副本 服务 器 处 。 
Globule 是 作为 Apache HTTP 服务 器 的 第 三 方 功能 模块 实现 的 ， 能 够 允许 任何 服务 器 
将 其 文档 复制 到 其 他 Globule 服务 器 。 为 了 复制 内 容 ， 内 容 提供 商 仅仅 需要 在 它们 的 
Apache 服务 器 上 再 安装 一 个 附加 模块 ， 并 编辑 一 个 简单 的 配置 文件 即 可 。 
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1.6 写 给 使 用 者 


本 节 主 要 对 未 来 CDN 业界 相关 研究 中 可 能 实现 的 下 列 技术 革命 进行 展望 。 

1. 一 个 统一 的 内 容 网 络 

为 了 使 内 容 转 换 、 处 理 以 及 基础 设施 服务 方便 易 用 ， 商 家 已 经 开发 了 内 容 服 务 网 
络 (CSN)" ， 能 够 作为 CDN 之 上 的 另 一 个 网 络 体系 架构 层 使 用 ， 并 能 够 提供 下 一 
代 的 CDN ARS. CSN 可 以 被 看 成 传统 CDN 的 变 体 。CSN 提供 的 网 络 资源 被 作为 “ 服 
务 ” 分 发 渠道 供 增值 服务 提供 商 使 用 ， 目 的 是 把 应 用 作为 基础 设施 服务 。 在 “内 容 
分 发 ”和 “内 容 服务 ”的 语 境 下 ， 目 前 内 容 和 服务 从 逻辑 上 是 分 离 的 ， 但 如 果 考 虑 
到 内 容 网 络 的 未 来 发 展 趋势 ， 这 种 状况 是 不 可 取 的 。 因 此 ， 一 个 统一 的 内 容 网 络 架 构 
应 当 支 持 组 件 间 的 相互 协作 和 内 容 以 及 服务 的 分 发 ， 这 是 未 来 的 发 展 趋 势 。 

2. 动态 内 容 

一 般 而 言 ， 动 态 内 容 是 指 在 使 用 Web 应 用 时 基于 用 户 请 求 所 产生 内 容 的 。 这 种 
内 容 的 生成 是 高 度 定制 化 的 ， 随 用 户 背 景 和 特性 的 不 同 而 不 同 。 大 量 的 Web 内 容 都 
是 动态 生成 的 ， 包 括 脚本 、 动 画 、DHTML 或 XML 页 面 ， 随 着 用 户 的 特定 需求 而 随时 
产生 。Web 页 面 的 动态 生成 可 以 通过 使 用 可 扩展 的 Web 应 用 托管 技术 来 进行 (如 前 
端 计算 “! 、 内 容 感知 的 数据 缓存 ”” 、 数 据 复制 ”以 及 内 容 未 知 的 数据 缓存 ) 。 
不 同 于 由 Web 服务 器 生成 的 动态 页 面 的 复制 ， 这 些 技术 的 目的 是 在 边缘 服务 器 上 复 
制 和 生成 页 面 ” 。 商 业 CDN 提供 商 具 有 适合 自身 的 解决 方案 和 应 用 服务 器 平台 来 处 
理 动态 内 容 。Akamai 公司 的 EdgeSuite 和 IBM 公司 的 Websphere 都 是 这 些 系统 的 典型 
例子 ， 它 们 能 够 提供 基于 使 用 的 应 用 和 (动态 ) 内 容 分 发 。 为 了 管理 动态 内 容 ， 一 
个 CDN 提供 商 可 能 会 使 用 这 些 可 扩展 的 技术 来 加 速 Web 页 面 的 动态 内 容 生 成 。 所 以 
相关 策略 的 选择 可 能 随 Web 应 用 的 特性 不 同 而 不 同 。 

3. Web 服务 

如 今 ， 已 经 有 一 部 分 商业 CDN 承载 了 Web IRS. Pld, Akamai 已 经 在 自己 的 网 
络 上 部 署 了 . NET ARF. Mirror Image 也 部 署 了 应 用 分 发 网 络 ( ADN) ， 能 够 在 自己 的 
边缘 服务 器 上 同时 托管 . NET 和 J2EE 的 应 用 。 若 干 研究 成 果 '，*” 也 已 经 表明 ，Web 
服务 性 能 低下 的 主要 原因 就 是 存在 对 处 理 的 需求 和 特定 托管 容量 的 问题 。 文 献 中 已 经 
提出 了 一 些 解决 方案 用 于 解决 Web 服务 在 边缘 服务 器 上 的 高 效 复制 问题 。Geng 等 
人 ”提出 在 网 络 和 多 ISP 之 间 的 可 共享 的 和 可 交换 的 缓存 架构 。 这 个 解决 方案 的 特 
点 在 于 设计 一 个 容量 配置 网 络 (CPN) ， 用 于 调整 缓存 容量 。CPN 由 一 个 交互 中 心 控 
制 ， 而 非 某 个 特定 CDN。 该 解决 方案 可 以 使 CDN 获取 (通过 交易 ) 必要 的 容量 来 满 
E Web 服务 缓存 的 要 求 。Takase 等 人 "提出 了 使 用 XML 报 文 进行 缓存 ， 并 通过 缓存 
XML 解析 器 的 事件 序列 来 得 到 性 能 提升 。 他 们 也 提出 了 使 用 Java 并 发 、 反 射 复制 和 
克隆 复制 的 方法 来 缓存 应 用 对 象 。 

4. 面向 服务 的 架构 

内 容 网 络 的 未 来 趋势 是 通过 标准 的 协议 和 调用 机 制 ， 允 许 一 个 服务 的 功能 由 其 他 
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服务 组 合 实现 。 因 此 ， 内 容 网 络 应 该 能 够 采纳 面向 服务 的 体系 架构 (SOA), ， 这 就 需 
要 SOA 内 部 具有 高 度 的 透明 性 ， 从 而 对 组 件 的 融合 技术 产生 影响 。 在 这 种 基于 SOA 
的 CDN 上 进行 内 容 管理 ， 希 望 与 用 户 偏好 紧密 相关 。 也 就 是 说 ， 在 未 来 CDN 中 , 全 
面 综合 的 管理 分 布 式 内容 和 服务 模型 对 终端 用 户 选择 所 需 的 喜爱 内 容 非 常 有 帮助 至 关 
重要 。 为 了 解决 这 个 问题 ， 内 容 可 以 进行 个 性 化 定制 ， 以 满足 特定 用 户 (或 者 一 组 
用 户 ) 的 需求 。 如 同 Web 个 性 化 “一样 ， 用 户 偏好 可 以 通过 数据 挖掘 技术 自动 地 从 
内 容 请 求 和 相关 数据 中 获得 。 在 内 容 网 络 上 使 用 数据 挖掘 技术 ， 基 于 SOA 的 CDN 可 
以 对 流量 、 定 价 和 记 账 /收费 进行 有 效 的 管理 ， 从 而 获得 极 大 的 性 能 提升 。 


1.7 未 来 研究 方向 


本 节 将 分 析 CDN 领域 面临 的 机 会 和 挑战 ， 这 些 都 有 可 能 推动 CDN 技术 的 革新 ， 
在 此 基础 上 为 CDN 的 研究 者 提供 一 个 未 来 的 发 展 方向 。 

1. 通过 协作 实现 负载 均衡 和 内 容 复 制 

无 论 传统 的 还 是 协作 式 CDN 结构 ， 有 效 的 内 容 复 制 和 缓存 都 有 着 至 关 重 要 的 作 
用 。 缓 存 “ 热 点 ”内 容 的 概念 并 不 算 新 ， 但 在 内 容 协 作 分 发 背景 下 ， 缓 存 “ 热 点 ” 
将 是 一 个 非常 重要 且 具 有 竞争 力 的 方法 。 使 得 请 求 本 地 区 响应 ， 而 且 要 关注 内 容 最 多 
请 求 的 区 域 。 未 来 的 研究 将 逐渐 趋向 于 动态 、 可 扩展 以 及 有 效 复制 机 制 ， 该 机 制 将 面 
向 用 户 需 求 。 此 外 ， 我 们 希望 出 现 将 复制 和 缓存 技术 相 集成 的 解决 方案 ， 这 在 协作 式 
的 方法 将 有 效 解决 动态 内 容 和 个 性 化 内 容 的 管理 问题 。 第 3 章 针 对 这 种 内 容 复 制 技术 
提供 了 更 多 的 信息 。 有 关 缓 存 复制 技术 的 一 体 化 应 用 以 及 缓存 一 致 性 机 制 的 详细 介绍 
将 在 本 书 的 第 4 和 第 5 章 中 给 出 。 

2. 采用 市 场 机 制 

经 济 模型 可 以 用 来 开拓 CDN 市 场 的 活力 ， 通 过 分 析 新 兴 市 场 的 行为 使 CDN 具有 
更 好 的 可 管理 性 。 同 时 ， 也 为 CDN 提供 资源 和 开放 更 多 有 兴趣 的 新 服务 带 来 更 多 的 
收益 市 场 机 制 的 采用 可 以 通过 SOA 来 实现 。 此 外 ， 复制、 资源 共享 、 负 和 载 均衡 策略 
需要 由 盈利 性 作为 引导 ， 以 满足 终端 用 户 的 QoS 要 求 。 有 关 CDN 的 经 济 性 设计 和 定 
价 的 信息 见 第 7 和 第 8 章 。 

3. 一 个 针对 流 媒体 的 自 适应 CDN 

承载 流 媒 体 点 播 服 务 是 非常 困难 的 ， 因 为 将 大 量 内 容 同时 传输 到 终端 用 户 意味 着 
大 量 网 络 和 带宽 的 需求 。 为 了 提高 性 能 和 避免 网 络 拥塞 ，P2P 技术 可 以 用 来 建设 自 适 
应 的 CDN 结构 。 在 该 系统 中 ， 从 流 服务 器 、 网 络 和 存储 资源 分 发 到 各 终端 用 户 内 容 
和 造成 的 工作 负载 被 有 效 地 分 散 开 来 ， 其 根本 思路 是 允许 多 个 订阅 者 同时 为 访问 相同 
视频 的 用 户 提供 服务 ， 而 不 是 传统 的 单一 服务 器 到 客户 端的 流 模式 ， 此 时 ， 每 个 客户 
端 只 需 存储 一 小 部 分 内 容 。 使 用 P2P 方法 的 流 媒体 能 够 节省 资金 ， 已 经 用 于 非 中 心 
化 流 媒体 架构 (DeMSI) 的 设计 "外 。 另 外 ， 在 开放 和 自 适 应 流 CDN 中 对 媒体 流 服务 
进行 协作 控制 的 相关 工作 将 在 第 12 章 进行 介绍 。 
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4. 移动 动态 CDN 

大 量 高 流动 性 用 户 的 信息 分 发 使 移动 网 络 越 来 越 受到 关注 。 与 有 线 网 络 相 比 ， 移 
动 网 络 可 以 根据 用 户 的 流动 性 提供 更 强 的 潜在 多 样 化 服务 。 移 动 网 络 的 内 容 需 求 在 空 
间 和 时 间 上 表现 出 很 强 的 变化 性 ， 相 应 的 分 发 技术 必须 考虑 到 这 些 特点 ， 以 实现 系统 
的 动态 配置 ， 并 减 小 网 络 主干 部 分 的 总 流量 。 移 动 动态 CDN 模型 的 设计 应 该 力求 解 
决 用 户 的 准确 接 人 ， 信 息 及 时 更 新 及 相关 企业 应 用 问题 。 这 种 用 于 企业 网 的 移动 动态 
CDN 模型 和 相关 的 内 容 管理 策略 由 Aioff && AU? 提出 。Ortiva Wireless" 就 是 CDN 提 
供 商 商 业 模型 的 一 个 案例 ， 它 可 以 向 移动 用 户 分 发 视频 、 音 频 以 及 多 媒体 内 容 。 更 多 
有 关 移 动 CDN 信息 传播 的 内 容 将 在 第 14 章 介 绍 。 

S. 通过 互联 /对 等 /代理 的 内 容 分 发 

目前 内 容 网 络 的 趋势 和 内 容 联 网 能 力 激发 了 人 们 对 于 内 容 网 络 互联 的 兴趣 。CDN 
之 间 通 过 相互 协作 可 以 获取 高 质量 服务 ， 这 种 协作 提供 了 一 种 在 不 同 CDN 系统 间 重 
新 进行 内 容 分 发 的 手段 。 引 入 协作 后 能 够 服务 的 用 户 数量 远 远 超 过 单个 CDN 所 能 达 
到 的 数量 。 因 此 ， 未 来 研究 将 重点 关注 CDN 之 间 的 互联 、 代 理 以 及 对 等 组 织 等 方面 
KERARI, CDN 互联 的 详细 内 容 在 第 16 章 给 出 。 


1.8 结论 


本 章 向 读者 呈现 了 CDN 的 现状 ， 并 对 目前 应 用 于 内 容 分 发 领域 的 技术 进行 了 深 
入 的 分 析 。 通 过 分 析 目 前 内 容 网 络 的 趋势 ， 可 以 预言 ， 将 新 技术 与 现 有 技术 (如 代 
理 、P2P、 网 格 和 数据 挖掘 等 ) 相 结合 ， 可 以 提升 未 来 CDN 架构 的 性 能 。 同 时 ， 我 们 
发 现 CDN 行业 可 能 会 发 生 一 些 变化 ， 如 由 CDN 互联 、 自 适应 CDN, Hah CDN 向 完全 
的 、 基 于 社区 的 CDN 转变 。 因 此 ， 以 本 章 的 内 容 为 铺垫 ， 后 面 的 章节 中 将 向 读者 提供 
更 深入 的 分 析 ， 使 读者 对 内 容 分 发 领域 的 现状 以 及 未 来 的 趋势 获得 一 个 完整 的 理解 。 
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第 2 童 CDN 分 类 法 


Mukaddim Pathan 和 Rajkumar Buyya 
2.1 引言 


CDN'””1 近 来 引起 学 术 上 的 广泛 关注 ， 研 究 涉及 其 分 类 、 特 性 、 缺 陷 、 机 遇 以 及 
前 景 。 其 中 ，Peng" 针 对 现存 的 CDN 给 出 了 一 个 总 结 ， 介 绍 了 在 设计 和 实现 高 效 
CDN 时 涉及 的 关键 问题 ， 并 对 相关 的 解决 方案 进行 了 综述 。Vakali 等 人 中 针对 CDN 
架构 和 主要 CDN 服务 提供 商 作 了 综述 ， 重 点 关注 如 何 理解 CDN 框架 及 其 效用 ， 并 给 
出 了 内 容 网 络 领域 的 若干 特点 及 现 有 成 果 。 同 时 提出 了 一 个 CDN 的 进化 方向 ， 目 的 
在 于 探索 现 有 内 容 网 络 的 发 展 趋势 。Dilley 4& AU? 对 CDN My P3885 Akamai " 的 整体 
系统 架构 进行 了 分 析 ， 提 供 了 针对 现 有 内 容 分 发 方法 的 综述 ， 并 详细 描述 了 Akamai 
网 络 架构 及 其 运行 机 制 ， 指 出 了 在 构建 大 型 CDN (如 Akamai) 时 面 对 的 技术 挑战 。 
Saroiu 等 人 中 针对 四 大 内 容 分 发 系统 进行 了 分 析 : 超 文本 传输 协议 (HTTP) Web 浏 
览 、Akamai 网 络 、Gnutella” ?) $t KaZaa 点 对 点 文件 共享 系统 '““” ， 并 对 那些 大 型 的 
组 织 和 服务 提供 商 、 网 络 基础 设施 架构 提供 商 和 一 般 的 内 容 分 发 提供 商 给 出 了 建议 。 
Kung 等 人 "J 描述 了 CDN 的 分 类 并 引入 了 一 类 新 型 的 内 容 网 络 ， 该 内 容 网 络 能 够 实现 
内 容 的 “语义 聚合 和 内 容 敏感 放置 "。 他 们 基于 以 下 两 点 将 内 容 网 络 分 为 两 类 : 内 容 
聚合 和 内 容 放置 。Sivasubramanian 等 人 中 1 讨论 了 在 建立 一 个 网 页 副本 托管 系统 时 过 
到 的 问题 。 因 为 缓存 架构 是 CDN 中 的 重要 组 成 部 分 (如 Akamai 等 ) ， 同 时 因为 内 容 
分 发 是 由 源 服务 器 开始 ， 因 此 他 们 将 CDN 视 为 副本 托管 系统 。 在 此 范围 内 ， 他 们 提 
出 了 一 个 体系 框架 ， 总 结 相关 研究 工作 并 进行 分 类 。 针 对 P2P 内 容 分 发 技术 的 一 个 
综述 "研究 了 现 有 的 P2P 系统 ， 并 通过 非 功 能 特性 如 安全 性 、 匿 名 性 、 公 平 性 、 可 
扩展 性 的 增加 和 性 能 以 及 资源 管理 和 组 织 能 力 等 方面 对 其 进行 分 类 。 通 过 该 研究 ， 作 
者 分 析 了 系统 设计 对 这 些 特性 的 影响 ， 并 给 出 了 一 些 有 价值 的 结论 。Cardellini 等 
人 “研究 了 分 布 在 局 部 区 域内 的 多 服务 器 节点 网 络 系统 架构 的 现状 ,提出 了 这 些 架 
构 的 分 类 法 ， 并 分 析 了 相关 路 由 机 制 及 调度 算法 ， 进 而 提出 了 未 来 该 领域 的 研究 
方向 。 


2.1.1 动机 与 范围 


如 上 所 述 ， 现 有 工作 已 考虑 了 CDN 的 诸多 方面 ， 如 内 容 分 发 、 复 制 、 缓 存 、 
Web 服务 器 放置 等 。 然 而 ， 上 述 文献 并 未 从 功能 性 和 非 功能 性 方面 对 CDN 进行 分 类 
研究 。 包 括 技术 应 用 和 CDN 的 操作 ， 而 后 者 关注 CDN 的 特性 ， 如 组 织 、 管 理 和 性 能 
等 。 本 章 的 方法 则 考虑 到 CDN 的 功能 性 和 非 功能 性 两 方面 ， 因 此 有 助 于 考察 CDN 的 
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架构 设计 决策 对 CDN 特性 的 展现 方式 和 影响 方式 。 因 此 ， 本 章 的 目标 是 提出 一 个 综 
合 的 CDN 分 类 ， 使 其 能 够 识别 和 分 类 与 各 种 动态 设计 相关 的 技术 和 解决 方案 。 

本 章 提出 的 分 类 法 围绕 建立 一 个 CDN 系统 的 核心 问题 展开 。 具 体 而 言 ， 本 章 主 
要 关注 在 CDN 构建 中 会 带 来 挑战 的 如 下 问题 : 

(1) 一 个 合理 规划 的 CDN 应 该 有 哪些 组 成 部 分 

研究 内 容 主 要 包括 CDN 组 织 类 型 、 节 点 间 的 交互 、 关系 以 及 内 容 /服务 类 型 等 

(2) 如 何 开展 有 效 的 内 容 分 发 和 管理 

研究 内 容 主要 包括 对 于 内 容 选择 、 代 理 放置 策略 、 内 容 外 包 和 缓存 管理 方法 等 。 

(3) 如 何 将 客户 端 请 求 路 由 到 合适 的 CDN 节点 

研究 内 容 主要 包括 动态 、 可 扩展 和 高 效 的 路 由 技术 。 

(4) 如 何 衡量 一 个 CDN 的 性 能 

主要 指 预测 、 监 控 和 确保 CDN 端 到 端 性 能 的 能 力 。 

一 个 完备 的 CDN 系统 设计 还 需要 考虑 其 他 因素 ， 以 使 系统 更 加 和 鲁 棒 、 容 错 〈 具 
有 检测 广 域 错 误 的 能 力 ) 、 安 全 并 能 够 进行 大 范围 的 应 用 托管 。 在 此 范围 内 ， 还 需要 
考虑 如 下 问题 : 

1) 如 何在 CDN 中 处 理 广 域 错误 ， 即 利用 适当 工具 和 系统 进行 错误 检测 。 

2) 如 何 确保 广 域 内 CDN 系统 的 安全 性 ， 主 要 指针 对 分 布 式 安全 威胁 的 解决 
方案 。 

3) 如 何 进 行 广 域 的 应 用 托管 ， 主 要 涉及 开发 合适 的 技术 来 确保 CDN 能 够 进行 应 
用 托管 。 

以 上 每 一 个 问题 就 其 自身 而 言 都 是 一 个 独立 的 研究 领域 ， 其 解决 方案 和 技术 均 可 
在 相关 文献 和 具体 应 用 中 找到 。 虽 然 对 于 CDN 开发 而 言 ， 有 必要 为 上 面 三 个 额外 问 
题 找到 合适 的 解决 方案 ， 但 本 章 研究 的 分 类 法 主要 关注 的 是 首先 提出 的 四 个 核心 方 
面 。 然 而 ， 本 章 也 提出 了 针对 上 述 额外 问题 的 观点 ， 并 提供 了 近期 相关 的 研究 工作 。 
因此 ， 读 者 能 够 得 到 足够 的 材料 来 对 各 方面 问题 进行 综合 ， 并 对 自己 感 兴趣 的 课题 直 
接 开展 研究 。 


2. 1. 2 贡献 和 组 织 结 构 


本 章 的 贡献 主要 分 为 两 点 : 

(1) 提出 了 一 个 CDN 分 类 法 

本 章 全 面 概括 了 CDN 相关 领域 ， 并 对 CDN 的 应 用 、 特 性 和 实践 技术 提供 了 综合 
性 的 解释 。 该 分 类 法 的 目的 在 于 探索 CDN 的 功能 特性 和 非 功 能 特性 ， 并 提供 针对 相 
关 领 域 的 解决 方案 及 技术 的 分 类 。 

(2) 对 分 类 法 进行 了 验证 

本 章 使 用 该 分 类 法 对 若干 有 代表 性 的 CDN 进行 分 类 和 分 析 ， 以 此 验证 其 效果 。 
此 外 ， 该 分 类 法 有 助 于 在 该 领域 内 进行 “缺口 ”分 析 ， 并 解释 相关 领域 内 的 核心 


概念 。 
本 章 余下 内 容 组 织 如 下 : 首先 2.2 节 提 出 CDN 分 类 法 ; 在 2.3 节 将 分 类 法 应 用 
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到 若干 有 代表 性 的 CDN 系统 中 ， 并 得 出 若干 结论 ; 在 2.4 节 中 讨论 CDN 开发 的 其 他 
问题 ， 重 点 关注 错误 处 理 、 安 全 和 应 用 托管 等 方面 ; 最 后 ,在 2.5 节 中 给 出 总 结 。 


2.2 分 类 法 

本 节 给 出 一 个 CDN 分 类 法 ， 它 基于 四 个 要 素 ， | CDN 的 构成 
EP CDN 的 构成 、 内 容 分 发 和 管理 、 请 求 路 由 和 性 能 nsa Speen 
测量 ， 如 图 2. 1 所 示 。 ies 


第 一 个 问题 涉及 CON 的 组 织 和 形成 的 很 多 方面 ， eoi CDN 的 分 类 
该 分 类 法 将 CDN 通过 其 结构 属性 进行 分 类 ; 第 二 个 
问题 是 关于 CDN 内 容 分 发 机 制 ， 主 要 描述 了 代理 放置 、 内 容 选择 和 分 发 、 外 包 以 及 
缓存 /副本 的 组 织 等 内 容 分 发 和 管理 方法 ; 第 三 个 问题 描述 现 有 CDN 中 的 请 求 路 由 技 
术 ， 而 最 后 一 个 问题 主要 讨论 CDN 中 衡量 性 能 指标 的 方法 。 


2.2.1 CDN 的 构成 


对 CDN 结构 属性 的 分 析 表 明 ，CDN 设施 中 的 各 组 件 之 间 紧 密 相关 。 并 且 ，CDN 
结构 灵活 多 变 ， 随 内 容 和 服务 的 不 同 而 不 同 。 在 一 个 CDN 结构 内 ， 存 在 一 组 代理 组 
存 服务 器 ， 用 来 生成 内 容 分 发 组 件 。 通 过 一 些 关 系 和 机 制 的 组 合 ， 用 户 请 求 被 重 定向 
到 一 个 代理 缓存 服务 器 ， 交 互 协议 用 于 CDN 组 件 之 间 的 通信 。 

图 2. 2 展示 了 CDN 基于 多 种 结构 特性 的 分 类 法 。 这 些 特性 对 于 CDN 组 件 至 关 重 
要 ,它们 表明 了 CDN 组 件 之 间 的 组 织 、 使 用 服务 器 的 类 型 、 关 系 、 交 互 以 及 所 提供 
的 不 同 内 容 和 服务 。 


CDN 的 构成 


CDN 服务 器 关系 内 容 / 


交互 
协议 服务 类 型 










覆盖 法 — 网 络 法 源 服 ”副本 M o 缓存 间 
务 器 ”服务 器 交互 


件 交 互 





ii 动态 服务 
内 内 容 


客户 端 -代理 - 网 络 组 件 - 代理 间 流 媒 体 
源 服 务 器 缓存 代理 


态 
容 


缓存 代理 ”缓存 代理 
阵列 网 格 
图 2.2 CDN 组 构成 的 分 类 


1. CDN 组 织 


建立 一 个 CDN 一 般 有 两 种 途径 : 覆盖 法 和 网 络 法 ” 。 在 覆盖 法 中 ， 网 络 中 不 同 
地 点 的 特定 应 用 服务 器 和 缓存 服务 器 负责 特定 内 容 类 型 的 分 发 ( 如 网 页 内 容 、 流 媒 


第 2 章 CDN 分 类 法 27 
体 和 实时 视频 ) 。 不 同 于 针对 特定 请 求 /流量 控制 去 提供 基本 网 络 连接 和 确保 网 络 质 
量 ， 核 心 网 络 组 件 〈 如 路 由 器 和 交换 机 等 ) 并 不 在 内 容 分 发 中 起 关键 作用 。 大 多 数 
商业 CDN 提供 商 (如 Akamai 和 Limelight 等 ) 使 用 覆盖 法 来 组 织 CDN。 这 些 CDN 提 
供 商 将 内 容 复制 到 遍布 全 球 的 缓存 服务 器 中 ， 当 接收 到 来 自 终端 用 户 的 内 容 请 求 时 ， 
这 些 请 求 被 重 定向 到 最 近 的 CDN 服务 器 上 ， 从 而 加 快 了 网 站 的 响应 时 间 。 因 为 CDN 
提供 商 不 需要 控制 内 在 的 网 络 组 件 ， 因 此 覆盖 法 简化 了 管理 并 对 引入 新 服务 提供 了 可 
能 性 。 

在 网 络 法 中 ， 网 络 组 件 〈 如 路 由 器 和 交换 机 等 ) 中 预 置 了 相关 程序 ， 用 于 识别 
特定 的 应 用 类 型 以 及 根据 预定 义 的 策略 转发 请 求 。 例 如 ， 一 些 设备 将 请 求 重 定向 到 本 
地 缓存 ， 或 者 将 到 达 数 据 中 心 的 流量 转 到 某 些 经 优化 后 专用 于 服务 特定 内 容 类 型 的 特 
定 服务 器 。 一 些 CDN (如 Akamai、Mirror Image 等 ) 同时 使 用 两 种 方法 来 进行 组 织 。 
在 这 样 的 情况 下 ， 一 个 网 络 组 件 (如 交换 机 ) 可 以 在 服务 器 集群 的 前 端 工作 ， 并 将 
请 求 重 定向 到 附近 的 特定 应 用 代理 服务 器 。 

2. 服务 器 

CDN 使 用 的 服务 器 分 为 两 种 类 型 : 源 服务 器 和 副本 服务 器 。 具 有 决定 性 意义 和 
最 完备 的 内 容 版 本 存储 在 源 服务 器 上 ， 由 内 容 提 供 商 负责 更 新 。 另 外 ,一 台 副 本 服务 
器 会 存储 内 容 的 副本 ， 但 是 也 可 以 用 做 对 客户 端 提 供 服 务 的 授权 备 选 服务 器 。 源 服务 
器 与 分 布 式 的 副本 服务 器 彼此 进行 通信 ， 以 更 新 副本 服务 器 的 内 容 。CDN 中 的 副本 
服务 器 可 作为 媒体 服务 器 、 网 页 服务 器 或 缓存 服务 器 。 一 个 媒体 服务 器 安装 包括 媒体 
服务 器 软件 ， 可 以 服务 于 任何 数字 和 经 编码 的 内 容 。 在 响应 特定 客户 端的 请 求 时 ， 媒 
体 服 务 器 可 以 提供 特定 视频 或 者 音频 片段 。Web 服务 器 包含 流 媒 体 的 链接 以 及 其 他 
CDN 需要 处 理 的 基于 Web 的 内 容 。 缓 存 服 务 器 在 网 络 边缘 进行 源 服务 器 内 容 的 复制 
(副本 或 内 容 缓存 ) ， 无 须 每 个 内 容 请 求 都 经 由 源 服务 器 来 响应 。 

3. 关系 

CDN 复杂 的 分 布 式 结构 展现 了 组 件 之 间 不 同 的 关系 ， 如 图 2.3 所 示 。 这 些 关系 
涉及 的 网 络 组 件 包括 客户 端 、 代 理 、 源 服务 器 、 代 理 缓存 及 其 他 网 络 设备 。 这 些 组 件 
在 CDN 内 部 与 副本 和 缓存 内 容 进 行 通信 。 复 制 负责 不 同 计 算 机 系统 上 给 定 内 容 副本 
的 创建 和 维护 ， 主 要 是 将 内 容 从 源 服务 器 “ 推 ” 到 副本 服务 器 '" 。 另 外 ， 缓 存 完成 
那些 可 缓存 响应 的 存储 ， 以 降低 响应 时 间 以 及 将 来 处 理 这 些 响应 所 需要 的 网 络 带宽 
“ee. 

在 一 个 CDN 环境 中 ， 内 容 分 发 的 基本 关系 存在 于 客户 端 、 代 理 缓存 服务 器 和 源 
服务 器 三 者 之 间 。 客 户 端 可 以 与 代理 缓存 服务 器 通信 ， 而 不 需要 向 一 台 或 多 台 源 服务 
器 发 送 请 求 。 在 没有 使 用 代理 缓存 服务 器 的 区 域 ， 客 户 端 则 直接 与 源 服务 器 通信 。 用 
户 和 代理 缓存 服务 器 之 间 的 通信 以 透明 方式 进行 ， 就 如 同 与 源 服务 器 通信 一 样 。 代 理 
缓存 服务 器 通过 本 地 缓存 响应 客户 端 请 求 ， 或 充当 源 服务 器 的 网 关 。 在 图 2. 3a H, 
显示 了 客户 端 、 代 理 缓存 服务 器 和 源 服务 器 之 间 的 关系 。 

如 前 所 述 ，CDN 可 以 使 用 网 络 法 构建 ， 其 中 网 络 组 件 ( 如 路 由 器 、 交 换 机 等 ) 
通过 逻辑 关系 部 署 ， 将 流量 转移 到 能 够 处 理 用户 请 求 的 缓存 服务 器 (caching servers) 
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或 代理 服务 器 (proxy); 。 这 种 情况 下 ， 客 户 端 、 网 络 组 件 和 缓存 服务 器 /代理 服务 器 
(或 代理 服务 器 阵列 ) 之 间 的 关系 如 图 2.3b 所 示 。 除 了 上 述 关系 ，CDN 中 的 缓存 代 
理 可 以 彼此 之 间 通 信 。 一 个 代理 服务 器 中 的 缓存 是 一 个 应 用 层 的 网 络 服务 ， 它 用 于 组 
存 网 络 对 象 。 代 理 缓存 服务 器 可 被 多 用 户 同时 访问 和 共享 。CDN 代理 服务 器 中 的 组 
存 和 ISP 的 缓存 之 间 的 关键 区 别 在 于 前 者 仅 为 特定 的 内 容 提供 商 (BD CDN 的 客户 ) 
提供 内 容 服 务 ， 而 后 者 服务 于 所 有 的 Web 网 站 。 

依靠 代理 服务 器 间 的 通信 '" ， 带 缓存 功能 的 代理 服务 器 表现 为 某 种 代理 服务 器 
阵列 [ 见 图 2.3c] 或 某 种 代理 服务 器 网 络 [图 2.3d] 的 形式 。 一 个 缓存 代理 服务 器 
阵列 是 缓存 代理 服务 器 之 间 紧 密 耦合 的 组 合 。 在 缓存 代理 服务 器 阵列 中 ， 一 台 代 理 服 
务 器 充当 主 服务 器 ， 与 其 他 缓存 代理 服务 器 进行 通信 。 一 个 用 户 代 理 (agent) 可 以 
与 该 缓存 阵列 进行 交互 。 一 个 缓存 代理 服务 器 网 络 是 缓存 代理 服务 器 之 间 某 种 松散 耦 
合 的 组 合 。 不 同 于 缓存 代理 服务 器 阵列 ， 当 缓存 代理 服务 器 之 间 一 一 对 应 时 ， 代 理 服 
务 器 网 络 才 被 创建 。 在 缓存 代理 服务 器 网 络 中 ， 通 信 可 在 同 层 的 成 员 中 进行 ， 也 可 在 
分 层 的 子 成 员 和 父 成 员 间 中 进行 。 一 人 台 缓 存 服务 器 在 代理 服务 器 网 络 中 充当 网 关 ， 转 
发 来 自 客户 端 处 的 本 地 代理 服务 器 所 发 出 的 请 求 。 
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图 2.3 关系 


a) 客户 端 一 代理 缓存 服务 器 一 源 服务 器 b) 网 络 中 组 件 到 缓存 代理 服务 器 
c) 缓存 代理 服务 器 阵列 d) 缓存 代理 服务 器 网 络 


4. 交互 协议 

基于 前 述 的 通信 关系 ， 现 在 可 以 辨识 CDN 组 件 之 间 使 用 的 交互 协议 。 交 互 可 以 
大 致 分 为 两 类 : 网 络 组 件 间 的 交互 和 缓存 间 的 交互 。 图 2. 4 展示 了 一 个 CDN 内 组 件 
之 间 交 互 所 使 用 的 不 同 协议 。 网 络 组 件 之 间 交 互 协议 包括 网 络 组 件 控制 协议 
(NECP) 和 网 页 缓存 控制 协议 (WCCP)， 而 缓存 交互 协议 包括 缓存 阵列 路 由 协议 
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(CARP)、 互 联网 缓存 协议 (ICP)、 超 文本 缓存 协议 (HTCP) 以 及 缓存 摘要 (Cache 
Digest) 等 。 
网 络 组 件 控制 协议 (NECP) 


fA Web 缓 存 控制 协议 
adde 缓存 阵列 路 由 协议 (CARP) 
= 互联 网 缓存 协议 (ICP) 
超 文本 缓存 协议 (HTCP) 
缓存 摘要 
图 2.4 交互 协议 


网 络 组 件 控制 协议 (NECP) "是 服务 器 和 转发 流量 的 网 络 组 件 之 间 彼 此 通信 时 
使 用 的 轻 量 级 协议 。 网 络 组 件 由 若干 设备 组 成 ， 包 括 “ 内 容 已 知 ” 的 交换 机 和 负载 
均衡 路 由 器 ，NECP 人 允许 网 络 组 件 在 服务 器 集群 间 保持 负载 均衡 以 及 完成 至 监听 代理 
服务 器 的 重 定向 。 然 而 ， 它 并 不 规定 任何 特定 的 负载 均衡 策略 ， 相 反 NECP 向 网 络 组 
件 提 供 感知 服务 器 容量 和 有 效 性 的 方法 ， 并 告知 哪些 请 求 可 以 被 服务 而 哪些 不 行 。 因 
此 ， 网 络 组 件 收集 必要 信息 来 做 出 负载 均衡 的 决策 ， 从 而 避免 了 协议 使 用 的 专用 性 带 
来 的 协议 间 互 不 兼容 问题 。NECP 可 以 广泛 用 于 各 种 服务 器 应 用 中 ， 包括 源 服务 器 、 
代理 服务 器 和 监听 代理 服务 器 。NECP 使 用 传输 控制 协议 (TCP) ， 当 服务 器 初始 化 时 
使 用 标准 端口 在 网 络 组 件 间 建立 一 个 TCP 连接 。 消 息 可 以 在 服务 器 和 网 络 组 件 间 双 
向 传递 。 大 多 数 消息 包括 一 个 带 有 反馈 和 确认 的 请 求 。 接 收 到 肯定 性 确认 信息 意味 着 

一 台 peer 的 若干 状态 得 到 了 记录 ， 这 个 状态 可 假定 一 直 存在 于 peer 中 直到 过 期 或 者 
peer 停止 运转 。 换 言 之 ,该 协议 使 用 了 “ 硬 状态 ”模型 。 me 
被 用 于 检测 在 此 通信 情况 中 的 崩溃 状态 。 当 一 个 节点 检测 到 它 的 peer BARE, 
就 假设 该 peer 中 的 所 有 状态 均 需 要 在 peer 启动 后 重新 加 载 。 

网 页 缓存 控制 协议 (WCCP) "负责 一 个 或 多 个 路 由 、 一 个 或 多 个 网 页 缓存 之 间 
的 交互 。 它 工作 在 监听 代理 服务 器 与 充当 重 定向 网 络 组 件 的 路 由 器 之 间 。 这 样 交互 的 
目的 在 于 建立 和 维护 一 组 路 由 器 中 被 选择 流量 类 型 的 透明 重 定向 。 被 选择 的 流量 被 重 
定向 到 一 组 网 页 缓存 中 ， 用 来 增强 资源 利用 率 和 最 小 化 响应 时 间 。WCCP 允许 一 台 或 
多 台 代 理 服务 器 注册 单一 路 由 来 接受 重 定向 流量 。 流 量 包括 用 户 浏览 WWW 服务 器 
中 页 面 和 图 片 的 请 求 (无 论 在 网 络 内 部 还 是 外 部 )， 并 响应 这 些 请 求 。 该 协议 允许 指 
定 其 中 一 台 代 理 服 务 器 来 告知 路 由 器 : 重 定向 流量 如 何在 代理 服务 器 阵列 中 分 布 。 
WCCP 不 仅 提供 技术 手段 来 具体 协调 用 于 分 配 网 页 缓存 间 负载 的 特定 方法 ， 还 提供 了 
路 由 和 缓存 之 间 传输 流量 的 方法 。 

缓存 阵列 路 由 协议 (CARP)! 史 是 一 个 基于 松散 耦合 代理 服务 器 列表 和 一 个 用 于 
划分 这 些 代理 服务 器 之 间 URL 空间 的 哈 希 函 数 的 分 布 式 缓存 协议 。 一 个 执行 CARP 
的 HTTP 客户 端 实现 的 CARP 可 以 将 用 户 请 求 路 由 到 代理 服务 器 阵列 中 的 任 一 成 员 。 
代理 阵列 成 员 表 可 以 通过 阵列 配置 URL 获得 的 简明 ASCI 文本 文件 定义 。CARP 的 哈 
希 函数 和 路 由 算法 提取 代理 服务 器 阵列 成 员 表 中 一 个 预先 定义 的 成 员 ， 并 动态 决定 哪 
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一 个 成 员 应 当成 为 被 URL 指向 的 资源 缓存 版 本 的 适当 容器 。 因 为 请 求 是 通过 代理 服 
务 器 进行 排序 的 ， 因 此 缓存 内 容 的 副本 将 被 删除 ， 同 时 全 局 缓存 命中 率 也 得 以 提高 。 
下 级 代理 服务 器 可 以 通过 将 被 代理 的 HTTP 资源 请 求 转 发 给 合适 的 代理 服务 器 阵列 成 
员 来 访问 缓存 资源 。 

互联 网 缓存 协议 OCP) 是 一 个 轻 量 级 的 报 文 格式 ， 用 于 缓存 间 的 通信 。 缓 存 
交换 ICP 请 求 并 响应 、 收 集 报 文 ， 用 于 选择 最 合适 的 地 点 来 定位 目标 。 不 同 于 作为 目 
标定 位 协议 ，ICP 报 文 可 同样 应 用 于 缓存 选择 。ICP 是 一 个 广泛 应 用 的 协议 。 虽 然 网 
页 缓存 使 用 HTTP 实现 目标 数据 的 传输 ， 但 大 多 数 缓存 代理 服务 器 都 以 某 种 形式 支持 
ICP, ICP 被 用 在 缓存 代理 服务 器 网 络 中 ， 可 以 实现 相 邻 缓存 中 特定 网 页 目标 的 定位 。 
一 个 缓存 服务 器 发 送 ICP 请 求 到 它 的 相 邻 服务 器 ， 同 时 相 邻 服务 器 的 响应 指示 出 是 否 
“命中 ” 。 若 短 时 间 内 未 能 收 到 相 邻 服 务 器 的 回复 ， 则 表明 网 络 阻塞 或 者 断 网 。 一 般 
而 言 ，ICP 工作 在 用 户 数据 报 协议 (UDP) 之 上 用 以 提供 网 页 缓存 应 用 的 重要 特征 。 
因为 UDP 是 不 可 靠 和 无 连接 的 网 络 传输 协议 ， 因 此 可 以 通过 计算 ICP 丢失 率 来 估计 
网 络 的 阻塞 和 可 用 性 。 这 种 丢失 率 检测 和 往返 时 间 (RTT) 一 起 ， 提 供 了 一 种 缓存 之 
间 负 载 均衡 的 方式 。 

超 文本 缓存 协议 (HTCP) ”用 于 寻找 HTTP 缓存 、 被 缓存 数据 和 HTTP 缓存 管理 
集 ， 并 监控 缓存 特性 。HTCP 和 HTTP1. 0 兼容 ， 这 一 点 与 ICP 不 同 ， 因 为 ICP 是 针对 
HTTP 0. 9 版 本 推出 的 。HTCP 也 扩展 了 缓存 管理 域 ， 使 其 包含 监控 远程 缓存 的 添加 和 
删除 、 请 求 立 即 删除 和 发 送 关于 网 页 目标 的 建议 ， 如 可 缓存 目标 的 第 三 方 定 位 ， 或 者 
关于 测量 得 到 的 不 可 缓存 特性 或 者 网 页 目标 不 可 获得 性 的 建议 。HTCP 报 文 可 通过 
UDP 或 者 TCP 发 送 。HTCP 代理 必须 与 网 络 错误 和 延 时 结合 在 一 起 。 一 个 HTCP 代理 
应 当 在 服务 器 没有 响应 或 者 响应 信息 被 丢失 或 损坏 的 情况 下 充当 有 用 角色 。 

缓存 摘要 “是 一 个 交换 协议 和 数据 形式 。 它 提供 了 响应 时 间 和 其 他 缓存 间 通 信 
协议 (如 ICP 和 HTCP 等 ) 所 导致 出 现 的 拥塞 问题 的 相关 解决 方案 。 它 能 够 在 请 求 一 响 
应 交换 没有 发 生 的 情况 下 ， 支 持 缓存 服务 器 之 间 的 对 等 ， 相 比 而 言 ， 其 他 与 其 对 等 的 
服务 器 都 需要 取得 关于 服务 器 内 容 的 汇总 ( 如 摘要 等 ) 。 当 使 用 缓存 摘要 时 可 以 精确 
判断 某 一 特定 服务 器 是 否 缓存 一 个 给 定 的 URL。 通 常 的 做 法 是 通过 HTTP 实现 。 一 个 
对 等 成 员 在 收 到 对 其 摘要 的 请 求 后 ， 响 应 将 通过 HTTP 失效 头 信息 (HTTP Expires 
header) 来 确定 摘要 失效 时 间 。 因 此 ， 请 求 缓存 能 够 知道 它 何 时 应 当 请 求 对 等 摘要 的 
最 新 副本 。 除 了 HTTP 之 外 ,缓存 摘要 也 可 以 通过 FTP 进行 交换 。 虽 然 缓存 摘要 主要 
用 于 对 给 定 服务 器 URL 的 缓存 汇总 的 共享 ， 但 是 它 也 可 以 被 扩展 用 来 覆盖 其 他 数据 
源 。 缓 存 摘 要 在 用 来 消除 宛 余 和 更 好 地 利用 互联 网 服务 器 和 带宽 资源 时 可 以 作为 非常 
有 用 的 机 制 。 

5. 内 容 /服务 类 型 

CDN 提供 商 对 第 三 方 内 容 进行 托管 ， 实 现任 何 数据 内 容 的 快速 分 发 ,包括 静态 
内 容 、 动 态 内 容 、 流 媒体 (如 音频 和 实时 视频 )， 以 及 不 同 内 容 服 务 (如 目录 服务 、 
电子 商务 服务 和 文件 传输 服务 等 ) 。 这 些 内 容 来 自 大 企业 、Web 服务 提供 商 、 媒 体 公 
司 以 及 新 闻 媒介 。 内 容 和 分 发 服务 的 不 同 需 要 一 个 CDN 提供 商 选 择 使 用 特定 的 特性 、 
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架构 和 技术 。 出 于 这 个 原因 ， 一 些 CDN 专注 于 特定 内 容 分 发 和 (aR) 服务。 下面 将 
分 析 内 容 和 服务 类 型 的 特性 以 展示 它们 的 同 质 性 。 

静态 内 容 指 那些 改变 频率 很 慢 的 内 容 ， 它 们 不 随 用 户 请 求 而 变化 。 静 态 内 容 包括 
静态 HTML 页 面 、 内 嵌 图 片 、 可 执行 文件 、PDF 文档 和 软件 包 、 音 频 和 (或) 视频 
文件 等 。 所 有 的 CDN 提供 商都 支持 这 一 类 型 的 内 容 分 发 。 此 类 型 的 内 容 便于 缓存 ， 
其 更 新 可 以 通过 传统 缓存 技术 来 维护 。 

动态 内 容 指 那些 基于 用 户 个 性 化 需求 的 内 容 或 通过 执行 某 些 应 用 进程 得 到 的 基于 
需求 的 内 容 。 这 些 动态 内 容 变 化 迅速 ， 通 常 取决 于 用 户 需求 ， 包 括 动画 、 脚 本 以 及 
DHTML。 由 于 其 频繁 变化 的 本 性 ， 一 般 被 认为 不 可 缓存 。 

流 媒体 可 以 是 直播 的 也 可 以 是 点 播 的。 直播 媒体 的 分 发 可 以 用 于 直播 节目 ， 如 体 
育 节目 、 音 乐 会 、 频 道 和 (R) 新 闻 广 播 。 在 这 种 情况 下 ， 内 容 通 过 编码 器 实时 发 
送 到 媒体 服务 器 ， 最 终 传送 到 客户 端 。 在 点 播 分 发 中 ， 内 容 编码 完成 后 ， 以 流 媒体 文 
件 存储 在 媒体 服务 器 中 ， 内 容 可 基于 客户 端的 请 求 而 获得 点 播 的 媒体 内 容 包括 用 户 点 . 
播 的 音频 、 视 频 、 电 影 文件 和 音乐 前 辑 。 流 服务 器 使 用 专用 协议 通过 TP. 网 进行 内 容 
的 分 发 和 更 新 。 

一 个 CDN 可 以 提供 自身 的 网 络 资源 作为 服务 分 发 通道 ， 并 允许 增值 服务 提供 商 
以 互联 网 基础 设施 服务 的 方式 进行 应 用 服务 。 当 边缘 服务 器 托管 增值 服务 软件 以 供 内 
容 分 发 时 ， 它 们 的 运行 机 制 与 转 码 代理 服务 器 、 远 程 调 出 服务 器 或 代理 服务 器 很 类 
(oi) 。 这 些 服务 器 也 验证 了 增值 互联 网 架构 服务 的 处 理 和 特殊 托管 的 可 行 性 。CDN 
提供 的 服务 可 以 是 目录 、 网 络 存储 、 文 件 传输 和 电子 商务 服务 等 。CDN 提供 的 目录 
服务 被 用 来 访问 数据 库 服务 器 。 用 户 对 特定 数据 的 请 求 被 转发 到 数据 库 服务 器 ， 同 时 
那些 经 常 访问 的 结果 被 缓存 在 CDN 的 边缘 服务 器 上 。 网 络 存 储 服务 是 指 在 边缘 服务 
器 上 存储 内 容 ， 且 同样 是 基于 静态 内 容 分 发 技术 。 文 件 传输 服务 方便 了 软件 的 分 发 、 
病毒 库 升 级 、 电 影 点 播 以 及 高 清晰 度 医学 影像 在 全 球 范围 内 的 分 发 。 所 有 这 些 内 容 在 
本 质 上 均 为 静态 内 容 。 网 络 服务 技术 通过 CDN 的 维护 和 分 发 来 进行 更 替 。 电 子 商务 
是 一 种 非常 流行 的 通过 Web 进行 商业 交易 的 手段 。 电 子 商务 服务 中 的 购物 车 可 以 在 
边缘 服务 器 上 进行 存储 并 维护 ， 同 时 在 线 交易 (如 第 三 方 认证 、 信 用 卡 交易 等 ) 也 
可 以 通过 边缘 服务 器 进行 。 为 了 方便 此 项 服务 ，CDN 边缘 服务 器 应 当 具 备 对 于 电子 
商务 站 点 动态 内 容 的 缓存 能 力 。 


2.2.2 内 容 分 发 和 管理 


内 容 分 发 和 管理 对 于 CDN 的 高 效 内容 分 发 和 整体 性 能 而 言 至 关 重要 。 内 容 分 发 
包括 : 

(1) 内 容 选 择 和 分 发 

内 容 选择 和 分 发 基于 特定 用 户 的 请 求 频率 和 请 求 奖 漠 。 

(2) 代理 缓存 服务 器 的 放置 

代理 级 存 服务 器 按照 菜 种 特定 的 策略 放置 ， 使 边缘 服务 器 在 地 理 位 置 上 贴近 


用 户 。 
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(3) 内 容 外 包 

决定 采取 哪 一 种 外 包 策略 。 

(4) 内 容 管理 

内 容 管理 很 大 程度 上 取决 于 缓存 组 织 ， 如 缓存 技术 、 缓 存 维护 和 缓存 更 新 。 内 容 
分 发 和 管理 的 分 类 如 图 2. 5 所 示 。 


内 容 分 发 和 管理 
内 容 选 择 代理 缓存 内 容 缓存 
和 分 发 服务 器 放置 外 包 组 织 
单 ISP 多 ISP 缓存 缓存 
技术 更 新 
基于 协同 基于 非 协同 基于 协同 
推送 推送 拉 取 


图 2.5 内 容 分 发 和 管理 的 分 类 
L 内 容 选 择 和 分 发 
内 容 分 发 的 效率 高 低 在 于 恰当 地 选择 分 发 至 终端 用 户 的 内 容 。 一 个 合适 的 内 容 选 
择 方法 可 以 有 助 于 减少 客户 端的 下 载 时 间 和 服务 器 负载 。 图 2. 6 显示 了 内 容 选 择 和 分 
发 技术 的 分 类 。 从 图 中 可 以 看 到 ， 内 容 可 以 全 部 或 部 分 地 发 送 给 用 户 。 


内 容 选择 和 分 发 
全 站 点 部 分 站 点 
| 
整体 复制 (全 站 点 部 分 复制 
内 容 分 发 ) (A BOSE SR B9 437) 
AT 基于 流 基于 基于 聚 类 
经 验 行 度 对 象 


基于 用 户 基于 URL 
会 话 
图 2.6 内 容 选 择 和 分 发 技术 的 分 类 


将 整个 网 站 的 内 容 发 送出 去 是 一 种 简单 的 方法 ， 这 个 过 程 中 代理 缓存 服务 器 执行 
“整体 复制 ”功能 ， 将 所 有 内 容 全 部 分 发 给 终端 用 户 。 通 过 这 样 的 方式 ， 所 有 的 客户 
端 请 求 仅 通过 一 个 CDN 服务 器 进行 处 理 ， 该 CDN 服务 器 负责 发 送 全 部 内 容 ， 而 内 容 

提供 商 则 据 此 来 配置 自己 的 DNS。 该 方法 的 好 处 在 于 简单 ， 然 而 考虑 到 网 络 对 象 在 持 
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续 增 长 ， 该 方法 并 不 适用 。 尽 管 存储 硬件 的 价格 在 下 降 ， 但 边缘 服务 器 的 存储 空间 永 
远 达 不 到 存储 所 有 内 容 的 要 求 。 另 外 ， 因 为 网 站 内 容 并 非 静 态 ， 因 此 更 新 如 此 巨大 的 
Web 对 象 集 是 不 可 行 的 。 

同时 ， 在 选择 和 分 发 部 分 内 容 的 方法 中 ,代理 服务 器 执行 “部 分 复制 ”功能 ， 
仅 从 相应 的 CDN 服务 器 中 分 发 菜 些 内 藤 对 象 ， 如 网 页 中 的 图 片 。 通 过 部 分 内 容 分 发 
的 方式 ， 内 容 提供 商 对 内 容 进行 修改 ,使 得 指向 特定 对 象 的 链接 在 经 CDN 服务 商 授 
权 过 的 域 中 具有 主机 名 。 因 此 ， 网 站 的 主页 从 源 服务 器 获取 ， 同 时 网 页 中 的 内 骨 对 象 
通过 CDN 缓存 服务 器 获取 。 部 分 选择 的 方法 要 比 全 部 选择 的 方法 更 好 : 前 者 既 减 轻 
了 源 服 务 器 的 负载 ， 也 缓解 了 负责 创建 内 容 的 网 络 设施 。 此 外 ， 因 为 内 骨 内 容 并 不 需 
要 频繁 更 新 ， 故 部 分 选择 的 方法 具有 更 好 的 性 能 。 

内 容 选择 取决 于 合适 的 用 于 复制 网 络 内容 的 管理 策略 。 基 于 选择 内 艇 对 象 来 进行 
复制 的 方法 中 ， 部 分 复制 方法 可 进一步 被 分 为 基于 经 验 的 、 基 于 访问 量 的 、 基 于 对 象 
的 和 基于 聚 类 的 内 容 复制 。 在 基于 经 验 的 方法 中 己 ] ， 网 站 管理 员 赁 经 验 选 择 需 要 复 
制 到 边缘 服务 器 的 内 容 。 实 现 这 一 经 验 性 决策 通常 使 用 启发 式 方法 。 该 方法 的 缺陷 在 
于 选择 正确 启发 式 方法 时 的 不 确定 性 。 在 基于 访问 量 的 方法 中 ， 访 问 量 最 高 的 对 象 被 
复制 到 代理 服务 器 中 ， 这 种 方法 很 耗 时 而 且 无 法 保证 获得 可 靠 的 对 象 请 求 统 计 信 息 ， 
因为 每 一 对 象 的 访问 度 差 别 极 大 。 此 外 ， 这 种 统计 方法 无 法 用 于 新 加 入 的 内 容 。 在 基 
于 对 和 象 的 方法 中 ， 内 容 以 对 象 为 单位 复制 到 代理 服务 器 中 。 该 方法 属于 贪 焚 法 ， 因 为 
每 一 个 对 象 被 复制 到 能 使 性 能 增益 最 大 的 代理 服务 器 中 (在 存储 容量 的 限制 条 件 
下 )'"。 昌 然 贪 禁 法 能 够 达到 最 好 的 效果 ， 然 而 在 具体 应 用 中 其 实现 复杂 度 相当 
高 。 在 基于 聚 类 的 方法 中 ， 网 络 内 容 通过 相关 性 或 者 访问 频 度 等 指标 进行 聚 类 ， 并 以 
不 同 的 分 类 为 单位 进行 复制 。 因 为 无 论 聚 类 数目 还 是 聚 类 的 大 小 都 是 未 知 的 ， 所 以 聚 
类 处 理 都 是 以 固定 的 聚 类 个 数 或 者 固定 的 最 大 聚 类 大 小 来 进行 。 内 容 聚 类 法 可 以 基于 
用 户 会 话 或 基于 URL。 在 基于 用 户 会 话 的 方法 中 "" ， 网 页 日 志文 件 按照 用 户 网 络 会 
话 的 相似 性 进行 用 户 的 聚 类 。 这 种 方法 的 优点 是 有 助 于 判定 具有 相同 浏览 模式 的 用 户 
组 和 相关 内 容 的 网 页 。 在 基于 URL 的 方法 中 ， 网 络 内 容 的 聚 类 通过 网 站 拓扑 决 
定 忆 2 ， 最 热门 的 对 象 通过 网 站 确定 并 以 聚 类 单位 进行 复制 ， 其 中 每 一 对 URL 之 间 
的 相关 距离 是 基于 特定 的 相关 度量 计算 得 到 。 实 验 数 据 表 明 ， 基 于 聚 类 的 方法 降低 了 
用 户 的 下 载 时 间 和 服务 器 的 负载 。 然 而 ， 此 类 方法 的 缺点 在 于 部 署 的 复杂 度 。 

2. 代理 缓存 服务 器 的 放置 

因为 代理 缓存 服务 器 (surrogate server) 的 放置 位 置 与 内 容 分 发 过 程 紧密 相关 ， 
所 以 为 每 一 台 代理 缓存 服务 器 选择 最 佳 放置 地 点 至 关 重 要 。 最 优 放 置 的 目的 在 于 降低 
用 户 访问 内 容 时 的 延 时 感受 以 及 最 小 化 从 服务 器 到 客户 端 传输 复制 内 容 的 全 局 网 络 带 
宽 消耗 。 以 上 两 种 度量 的 优化 可 以 降低 CDN 提供 商 的 设施 和 通信 成 本 。 因 此 ， 代 理 
缓存 服务 器 的 最 优 放 置 使 CDN 能 够 提供 高 质量 和 低 成 本 的 服务 ” 。 

图 2.7 展示 了 不 同 的 代理 缓存 服务 器 放置 策略 。 最 小 大 -= 中 心 问题 和 上 上 层 结构 
分 离 树 (K - HST) 等 理论 方法 将 服务 器 放置 问题 建 模 为 中 心 放置 问题 ， 其 定义 为 : 
对 于 给 定 中 心 放置 的 数量 ， 使 一 个 节点 与 最 近 中 心 的 最 大 距离 最 小 化 。K - HST 算 
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法 “通过 图 论 来 解决 服务 器 放置 问题 ， 其 中 网 络 由 图 C(Y, E) 表示， 其 中 了 是 节点 
集 ，ECV xV 是 链 路 集 。 算 法 由 如 下 两 步 组 成 。 
代理 缓存 服务 器 放置 策略 


可 扩展 


中 心 放置 RAE 拓扑 代理 热点 基于 树 的 
放置 策略 副本 放置 副本 放置 


问题 
图 2.7 代理 缓存 服务 器 的 放置 策略 


第 一 步 ， 从 完全 图 ( 父 分 类 ) 中 任 选 一 个 节点 ， 该 节点 某 邻 域内 的 所 有 节点 组 
成 一 个 新 的 分 类 〈 子 分 类 ) 。 子 分 类 的 半径 是 大， 其 中 上 小 于 父 分 类 的 直径 。 持 续 进 
行 该 过 程 ， 直 到 所 有 节点 都 位 于 自己 的 分 类 中 。 然 后 ， 经 迭代 得 到 一 个 分 类 树 RD 
点 是 整个 网 络 ， 叶 节点 是 网 络 的 每 一 个 节点 。 

第 二 步 ， 一 个 虚拟 节点 被 分 配 到 每 一 层 的 每 一 个 分 类 上 。 每 一 个 父 分 类 上 的 虚拟 
节点 成 为 子 分 类 上 的 虚拟 节点 的 父 节 点 。 每 一 个 虚拟 节点 汇聚 起 来 形成 树 。 随 后 使 用 
RERE, RA K - HST 树 需要 的 中 心 数量 ,其 中 中 心 与 节点 的 最 大 距离 不 大 于 D。 

Buh k - 中 心 问题 ”如 下 所 述 : 

1) 对 于 给 定 的 图 C (V, E) ， 其 每 个 边 都 按照 权重 < 的 非 递 减 次 序 排列 : eCe) < 
c(e,) <…<c(e,)， 构造 一 组 平方 图 G1 、G;、G。。G 的 每 一 个 平方 图 用 6 表示， 包含 
a Pam VAM (u, v). 

2) 计算 每 一 个 6 的 最 大 独立 集 M,。 一 个 5 的 独立 集 是 指 C 的 节点 集 ，G 中 的 
节点 之 间 至 少 存在 三 跳 ， 一 个 最 大 独立 集 M 定义 为 独立 集 VER V - 太 中 的 所 有 节 
点 都 与 六 中 的 节点 相距 最 多 一 跳 。 

3) 找到 最 小 的 i,， 使 得 M, < 天 ， 将 其 用 7 表示 。 

4) 最 终 ，M 为 具有 天 中 心 的 集 。 

由 于 这 些 算法 的 计算 复杂 度 较 高 ， 所 以 提出 了 一 些 启 发 性 算法 如 贪 楚 副本 放置 和 
拓扑 已 知 放置 策略 。 这 些 算法 属于 次 优 算法 ， 利 用 了 CDN 中 ， 如 工作 负载 模式 和 网 
络 拓扑 等 已 有 信息 ， 提 供 了 在 低 计 算 成 本 下 的 解决 方案 。 例 如 ， 贪 禁 算 法 ”在 N 个 
候选 节点 中 选择 M 个 服务 器 。 在 第 一 轮 ， 计 算 每 一 个 节点 的 开销 。 假 设 对 所 有 客户 
端的 访问 最 终 收敛 到 某 个 节点 。 算 法 将 选择 具有 最 低 开销 的 站 点 。 在 第 二 轮 ， 搜索 与 
上 次 找到 的 站 点 相连 的 具有 次 优 开销 的 下 一 个 站 点 。 重 复 该 操作 ， 直 到 M 个 服务 器 
完成 排序 。 贪 焚 算 法 能 够 在 不 完备 的 输入 数据 中 正常 工作 ， 但 是 它 需 要 网 络 中 客户 端 
位 置 以 及 所 有 节点 间距 的 先 验 知识 。 在 拓扑 放置 策略 中 ， 服 务 器 被 放置 在 以 出 度 
( 即 其 他 节点 和 该 节点 相连 的 个 数 ) 降序 排列 的 备 选 主机 上 。 此 处 假设 具有 更 多 出 度 
的 节点 能 够 以 较 小 的 延 时 与 更 多 节点 通信 。 此 方法 使 用 自治 域 (AS) 拓扑 ， 其 中 每 
一 个 节点 都 代表 一 个 单一 的 自治 域 ， 节 点 链接 对 应 边界 网 关 协 议 (BCP) 的 对 等 。 在 一 
个 改进 后 的 拓扑 放置 策略 中 ， 使 用 了 路 由 层 的 网 络 拓扑 而 非 自治 层 的 拓扑 。 在 此 方 


法 中 ， 每 一 个 与 路 由 器 相连 的 LAN 都 是 一 个 潜在 站 点 ， 用 于 放置 一 台 服 务 器 ， 而 非 每 
—^fr AS J&— ^W jS 
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其 他 的 服务 器 放置 算法 (如 热点 法 (Hot Spot)" 和 基于 树 的 副本 放置 方法 
(Tree - based) ^). 也 可 以 用 于 这 种 情况 。 热 点 法 将 副本 放置 在 产生 负载 最 大 的 客户 
端 附近 。 将 NN 个 潜在 站 点 根据 其 周围 产生 的 流量 进行 排序 ， 并 将 副本 置 于 前 M 个 产 
生 最 大 流量 的 站 点 处 。 基 于 树 的 副本 放置 方法 的 原理 是 基于 某 种 假设 ， 即 潜在 的 拓扑 
结构 是 树 。 该 算法 将 副本 放置 问题 建 模 为 动态 规划 问题 ， 在 此 方法 中 ， 一 个 树 了 被 划 
分 为 若干 小 树 7;,， 同 时 i 个 代理 的 放置 通过 在 每 一 个 小 树 也 中 以 最 优 方式 置 放 刀 个 代 
理 的 方法 来 实现 ， 其 中 上 = 2 t', 。 另 外 一 个 算法 是 扫描 法 ” ， 是 一 种 可 拓展 的 副本 


管理 框架 ， 能 够 产生 按 需 副本 并 将 其 组 织 成 为 应 用 层 上 的 组 播 树 。 此 方法 能 在 满足 客 
户 延 时 约束 和 服务 器 容量 限制 的 前 提 下 最 小 化 副本 服务 器 数量 。 更 多 关于 扫描 法 的 内 
容 可 参阅 本 书 第 3 章 。 

对 于 代理 缓存 服务 器 的 放置 ，CDN 管理 者 同样 需要 决定 服务 器 的 最 优 数 量 ， 一 
般 采 用 单 ISP 法 或 多 ISP 法 '“。 在 单 ISP 法 中 ,一 个 CDN 提供 商 一 般 在 网 络 边缘 部 署 
至 少 40 台 代理 缓存 服务 器 来 支持 内 容 分 发 "" 。 单 ISP 法 的 策略 ， 是 在 每 一 个 主要 城 
市 的 ISP 网 络 内 放置 一 到 两 台 代理 缓存 服务 器 ， 并 为 代理 缓存 服务 器 配置 较 大 的 缓存 
能 力 。 因 此 ， 一 个 全 球 网 络 的 ISP 可 以 具有 极 大 的 地 理 覆 盖 能 力 ， 并 不 需要 依赖 其 他 
ISP。 单 ISP 法 的 缺点 在 于 代理 缓存 服务 器 有 可 能 被 放置 在 离 CDN 提供 商 的 用 户 较 远 
的 地 点 。 在 多 ISP 法 中 ，CDN 提供 商 尽 可 能 多 地 在 全 球 ISP 的 网 络 接 人 点 (POP), 
部 署 代理 缓存 服务 器 。 这 样 ， 可 以 解决 单 ISP 面临 的 问题 ， 将 代理 缓存 服务 器 放置 在 
离 用 户 很 近 的 地 点 ， 使 内 容 可 以 可 靠 、 及 时 地 分 发 给 用 户 。 大 型 CDN 提供 商 如 Aka- 
mai 拥有 超过 25000 台 服 务 器 2] 。 但 是 除了 成 本 和 建设 复杂 度 之 外 ， 多 ISP 法 的 主 
要 缺点 在 于 ， 每 一 台 代理 缓存 服务 器 接收 到 的 内 容 请 求 变 得 更 少 (甚至 没有 ) ， 这 会 导 
致 资源 的 闲置 和 CDN 性 能 的 低下 ""。 对 以 上 两 种 方法 的 性 能 估计 表明 ， 单 ISP 法 对 于 
低 到 中 等 流量 的 站 点 表现 良好 ， 而 多 ISP 法 适用 于 大 流量 的 站 点 *]。 

3. 内 容 外 包 

在 CDN 基础 架构 中 给 定 一 组 放置 恰当 的 代理 缓存 服务 器 和 选 定 需要 分 发 的 内 容 
之 后 ， 选 择 高 效 的 内 容 外 包 方法 至 关 重 要 。 内 容 外 包 可 以 使 用 基于 协作 推送 法 、 基 于 
非 协作 拉 取 法 和 基于 协作 拉 取 法 等 。 

基于 协作 推送 的 方法 需要 对 被 送 到 代理 缓存 服务 器 的 内 容 进 行 预 读 取 。 内 容 从 源 
服务 器 中 被 推送 到 代理 缓存 服务 器 ， 代 理 缓存 服务 器 之 间 通 过 彼此 协作 来 降低 复制 和 
更 新 的 成 本 。 在 此 方案 下 ，CDN 维护 内 容 与 代理 缓存 服务 器 之 间 的 映射 关系 。 每 一 
个 请 求 都 被 指向 最 近 的 代理 缓存 服务 器 ， 或 者 直接 指向 源 服务 器 。 在 这 种 方法 中 ,使 
用 全 局 贪 禁 启 发 式 算法 ， 该 算法 适合 在 协作 代理 缓存 服务 器 之 间 做 出 复制 决策 ”。 
然而 ， 由 于 该 方法 尚未 被 任何 商业 CDN 提供 商 使 用 ， 所 以 目前 只 在 理论 上 具有 可 
ATE) " 

在 基于 非 协作 拉 取 的 方法 中 ， 客 户 端 请 求 被 转发 到 距离 他 们 最 近 的 代理 缓存 服务 
器 中 ， 如 果 出 现 缓存 未 命中 ， 代 理 缓存 服务 器 会 从 源 服务 器 中 读 取 数 据 。 大 多 数 主流 
CDN 提供 商 (Akamai, Mirror Image 等 ) 都 使 用 这 种 方法 。 该 方法 的 缺陷 在 于 很 难 先 
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定 最 优 的 服务 器 来 服务 内 容 请 求 “*! ， 多 数 CDN 使 用 这 种 方法 的 原因 是 基于 协作 推送 
的 方法 仍然 处 于 试验 阶段 ""]。 

协作 拉 取 方法 和 非 协 作 拉 取 方法 的 区 别 在 于 ， 如 果 缓 存 未 命中 ， 则 前 者 是 通过 代 
理 缓存 服务 器 之 间 的 彼此 协作 得 到 请 求 内 容 。 在 协作 拉 取 方法 中 ， 客 户 端 请 求 通过 
DNS 重 定向 机 制 被 转 到 最 近 的 代理 缓存 服务 器 。 通 过 使 用 分 布 式 索 引 ， 代 理 缓 存 服 
务 器 能 够 在 附近 找到 请 求 内 容 的 副本 ， 并 在 缓存 中 对 其 进行 存储 。 协 作 拉 取 方法 是 反 
应 式 的 ， 只 有 客户 端 请 求 某 数据 时 该 数据 才 被 缓存 。 一 个 学 术 CDN (Coral?) 就 是 
使 用 分 布 式 索 引 和 协作 拉 取 方法 ， 在 缓存 未 命中 的 情况 下 进行 代理 缓存 服务 器 之 间 的 
协作 。 

对 内 容 外 包 来 说 ， 决 定 对 哪 一 台 代理 缓存 服务 器 上 的 外 包 内 容 进行 复制 至 关 重 
要 。 若 干 参考 文献 中 显示 了 对 外 包 内 容 使 用 不 同 复制 策略 的 效果 。Kangasharju 等 
人 喇 使 用 了 四 种 启发 式 方法 ， 即 随机 法 、 流 行 度 法 、 单 一 贪 禁 法 和 全 局 贪 焚 法 ， 用 
于 外 包 内 容 的 复制 。Tset55 提出 了 一 系列 贪 焚 法 ， 通 过 均衡 代理 缓存 服务 器 的 负载 和 
容量 来 确定 其 放置 。Pallis 等 人 "提出 了 一 种 自 调整 和 无 参数 的 算法 ， 称 为 lat - cdn, 
该 算法 使 用 对 象 延 时 来 做 出 复制 决策 ， 实 现 CDN 代理 缓存 服务 器 外 包 内 容 的 最 优 放 
置 。 一 个 对 象 的 延 时 被 定义 为 从 发 出 对 网 络 对 象 的 请 求 到 完整 收 到 该 对 象 之 间 的 延 
时 。lat - cdn 的 一 个 改进 是 iDpU" ， 其 原理 是 把 延 时 和 对 象 负 载 一 并 考虑 ， 实 现 外 包 
对 象 到 代理 服务 器 的 放置 。 

4. 缓存 组 织 和 管理 

内 容 管 理 对 于 CDN 性 能 而 言 至 关 重 要 ， 主 要 与 缓存 组 织 密切 相关 。 缓 存 组 织 不 
仅 涉及 缓存 技术 和 缓存 更 新 频率 (确保 内 容 的 时 效 性 、 可 获得 性 和 可 靠 性 ) ， 还 包括 
缓存 和 复制 的 综合 利用 ， 这 对 CDN 的 高 效 内 容 管 理 很 有 用 。 如 果 在 CDN 中 同时 使 用 
复制 和 缓存 ， 那 么 感知 延 时 、 命 中 率 和 字 节 命中 率 等 方面 的 性 能 都 可 得 到 提升 。 
.另外 ,复制 和 缓存 的 组 合 能 够 有 助 于 应 对 瞬时 拥塞 问题 。 在 此 意义 下 ，Stamos 等 
人 中 提出 了 泛 化 的 非 参数 启发 式 方法 ， 能 够 将 Web 缓存 和 内 容 复 制 集成 起 来 。 他 们 
提出 了 一 种 放置 相似 性 的 方法 ， 称 为 SRC， 用 于 对 集成 的 水 平 进行 评估 。 另 一 种 集成 
方法 称 为 Hybrid， 将 静态 复制 和 Web 缓存 通过 一 种 LRU 模型 (由 Bakiras 45 AU" 提 
出 ) 集成 起 来 。Hybrid 法 能 够 迭代 地 用 静态 内 容 逐 渐 填 充 代理 缓存 服务 器 的 缓存 ， 
只 要 该 内 容 有 助 于 改善 响应 时 间 。 更 多 关于 缓存 和 复制 集成 使 用 的 内 容 可 参阅 本 书 第 
4 和 第 5 章 。 

CDN 中 的 内 容 缓存 可 以 采用 类 内 机 制 或 类 间 机 制 。 一 个 缓存 技术 的 分 类 法 如 图 
2.8 所 示 。 基 于 查询 、 基 于 摘要 、 基 于 目录 和 基于 哈 希 的 体系 方法 都 可 以 用 于 类 内 的 
内 容 缓存 。 在 基于 查询 的 方法 中 "" ， 如 果 缓 存 未 命中 ,那么 CDN 服务 器 将 广播 一 个 
请 求 给 其 他 协作 CDN 服务 器 。 这 种 方法 面临 的 问题 是 查询 流量 极 大 和 延 时 间 题 ， 因 
为 发 出 广播 的 CDN 服务 器 需要 在 没有 一 个 对 等 成 员 告知 拥有 被 请 求 的 内 容 之 前 ， 必 
须 等 待 来 自 协作 的 所 有 对 等 服务 器 的 响应 ， 直 到 收 到 最 后 一 个 “未 命中 ”信号 为 止 。 
因为 这 些 缺 点 ， 基 于 查询 的 方法 受制 于 使 用 过 程 中 产生 的 开销 。 基 于 摘要 的 方法 
解决 了 在 基于 查询 法 中 存在 的 海量 查询 请 求 问题 。 在 该 方法 中 ,每 一 个 CDN 服务 器 
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维护 一 个 由 其 他 协作 代理 缓存 服务 器 基于 查询 的 策略 
保持 的 内 容 摘要 。 协 作 代理 缓存 服务 基于 摘要 的 策略 

类 内 缓存 


ari Mt CDN 服务 器 来 得 知 任何 更 基于 目录 的 策略 
新 的 内 容 次 序 。 通 过 检查 内 容 摘 要 ， 
缓存 技术 





基于 哈 希 的 策略 
一 台 CDN 服务 器 可 以 将 一 个 内 容 请 求 基于 半 哈 希 的 策略 
路 由 到 特定 代理 缓存 服务 器 。 为 了 确 类 间 缓 存 ”一 基于 查询 的 策略 
保 正确 的 信息 同步 ， 相 互 协作 的 代理 图 2.8 缓存 技术 的 分 类 
缓存 服务 器 之 间 需 要 频繁 地 进行 信息 交换 ， 这 就 产生 了 大 量 的 通信 流量 ， 所 以 这 种 方 
法 的 缺点 是 更 新 所 带 来 的 流量 造成 了 较 大 的 系统 开销 。 基 于 目录 的 方法 "是 一 个 基 
于 摘要 法 的 中 心 化 版 本 ， 其 中 一 个 中 心 化 的 服务 器 保持 一 个 类 内 所 有 协作 代理 缓存 服 
务 器 的 所 有 内 容 ， 每 当 进行 本 地 更 新 时 ， 每 台 CDN 服务 器 仅仅 通知 目录 服务 器 ， 并 
查询 目录 服务 器 是 否 存在 本 地 缓存 中 内 容 缺 失 的 情况 。 这 种 方法 存在 潜在 的 性 能 瓶颈 
和 单 点 失效 问题 ， 因 为 目录 服务 器 是 从 所 有 协作 代理 缓存 服务 器 中 收 到 更 新 和 查询 流 
量 的 。 在 基于 哈 希 的 方法 中 号 ' 史 ， 所 有 的 协作 CDN 服务 器 维护 同一 个 哈 希 函数 ， 一 
个 指定 的 CDN 服务 器 保持 着 基于 内 容 的 URL、CDN 服务 器 的 IP 地 址 以 及 哈 希 函数 的 
相关 内 容 。 所 有 针对 该 特定 内 容 的 请 求 都 被 指向 被 指定 的 服务 器 。 基 于 哈 希 的 方法 较 
其 他 方法 而 言 更 为 高 效 ， 因 为 该 方法 具有 最 小 的 系统 开销 和 最 高 的 内 容 共 享 效 率 。 然 
而 ， 它 对 本 地 请 求 和 多 媒体 内 容 的 分 发 效率 不 佳 ， 因 为 本 地 用 户 的 请 求 被 转 到 其 他 被 
指定 的 CDN 服务 器 进行 服务 。 为 了 解决 这 个 问题 ,可 以 使 用 某 种 半 哈 希 方法 “1。 
在 半 哈 希 法 中 ， 本 地 CDN 服务 器 分 配 一 部 分 磁盘 空间 用 于 缓存 大 多 数 本 地 用 户 所 需 
要 的 常见 内 容 ， 其 余 磁 盘 空 间 用 于 与 其 他 的 CDN 服务 器 通过 哈 希 函数 进行 协作 。 如 
同 纯 哈 希 法 一 样 ， 半 哈 希 法 也 具有 低 系统 开销 和 高 内 容 共享 效 率 的 特点 ， 同 时 ， 它 还 
能 明显 增加 CDN 的 本 地 命中 率 。 

基于 哈 希 的 方法 并 不 适用 于 类 间 协 作 缓 存 ， 因 为 不 同类 所 代表 的 CDN 服务 器 在 
地 理 上 呈正 态 分 布 。 摘 要 法 和 目录 法 也 并 不 适合 类 间 协 作 缓存 ， 因 为 那些 代表 性 的 
CDN 服务 器 需要 维护 一 个 很 大 的 内 容 摘 要 和 (或 ) 目录 ， 以 记录 其 他 类 中 的 内 容 信 
息 。 因 此 ， 基 于 查询 的 方法 可 以 用 于 类 间 缓 存 "。 在 这 个 方法 中 ， 当 一 个 类 未 能 对 
用 户 内 容 请 求 服务 时 ， 它 会 查询 相 邻 的 类 ， 如 果 内 容 可 以 通过 相 邻 类 得 到 ， 该 类 就 返 
回 “ 匹 配 ” 报 文 ; 否则 ， 它 将 请 求 转 发 给 其 他 相 邻 类 。 一 个 类 内 的 所 有 CDN 服务 器 
均 使 用 哈 希 法 进行 内 容 请 求 服务 ， 而 类 中 那个 代表 性 的 CDN 服务 器 仅仅 向 指定 的 服 
务 器 进行 查询 ， 从 而 实现 对 内 容 请 求 的 服务 。 因 此 ， 这 个 方法 使 用 哈 希 法 进行 类 内 的 
内 容 路 由 ， 并 使 用 基于 查询 的 方法 实现 类 间 的 内 容 路 由 。 因 为 限制 了 查询 流量 的 规模 
和 解决 了 从 远 端 服务 器 通过 每 一 个 检索 报 文 的 空闲 时 间 和 TTL 值 去 检索 信息 的 延 时 
问题 ， 所 以 该 方法 在 性 能 上 有 所 提高 。 

CDN 中 代理 缓存 服务 器 上 的 被 缓存 对 象 具有 相关 的 失效 期 ， 一 旦 过 期 即 被 认为 
失效 。 确 保 内 容 的 时 效 性 对 于 客户 端 服务 的 信息 更 新 而 言 至 关 重 要 。 如 果 在 传递 信息 
中 存在 延 时 ，CDN 提供 商 就 需要 注意 内 容 是 否 一 致 和 (R) 过 期 。 为 了 管理 副本 服 
务 器 上 内 容 的 一 致 性 和 时 效 性 ，CDN 应 用 了 不 同 的 缓存 更 新 技术 。 缓 在 更 新 机 制 的 
分 类 如 图 2.9 所 示 。 
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最 常见 的 缓存 更 新 机 制 是 周期 性 更 ax 
新 。 为 了 确保 内 容 的 一 致 性 和 时 效 性 ， 
内 容 提供 商 在 源 Web 服务 器 上 进行 功 
能 配置 ， 告知 缓 存 什 么 内 容 是 可 缓存 ie TO HARM AE 
AIA AAS ATR! 上 n[ Hs 
通过 这 样 的 方式 ， 缓 存 以 某 种 固定 的 方式 刷新 。 但 是 ， 这 种 方法 的 缺点 在 于 每 次 更 新 
间隔 都 会 产生 大 量 不 必要 的 流量 。 更 新 传播 机 制 在 内 容 发 生 改 变 时 被 激活 ， 它 主动 地 
将 内 容 推送 至 CDN 缓存 服务 器 。 通 过 这 种 机 制 ， 只 要 源 服务 器 上 的 内 容 有 所 改变 ， 
一 个 文档 的 更 新 版 可 以 传播 至 所 有 缓存 。 对 于 频繁 改变 的 内 容 ， 这 个 方法 会 产生 较 大 
的 更 新 流量 。 按 需 更 新 是 另 一 种 缓存 更 新 机 制 ， 基 于 对 内 容 的 请 求 ， 某 文档 的 最 新 副 
本 被 传递 至 代理 缓存 服务 器 。 该 方法 假定 : 除非 有 特定 相关 请 求 ， 否 则 结构 和 内 容 无 
须 更 新 。 该 方法 的 缺点 是 ， 为 了 确保 被 传递 的 内 容 是 最 新 的 ， 源 服务 器 和 缓存 之 间 存 
在 大 量 的 往返 流量 。 另 外 一 种 缓存 更 新 技术 称 为 失效 法 ， 每 当 一 个 文档 在 源 服务 器 上 
发 生变 化 ， 一 个 失效 报 文 就 被 送 往 所 有 代理 缓存 服务 器 的 缓存 。 在 文件 改变 时 代理 组 
存 服务 器 被 暂时 禁止 访问 该 文 档 ， 每 一 个 缓存 需要 稍 后 自行 获取 文档 的 更 新 版 。 该 广 
法 的 缺陷 在 于 未 能 充分 利用 内 容 分 发 网 络 的 分 布 式 机 制 ， 而 且 延 后 的 内 容 获取 可 能 会 
导致 内 容 一 致 性 管理 的 低 效 。 

一 般 而 言 ，CDN 给 内 容 提供 商 以 控制 内 容 时 效 性 的 能 力 ， 并 确保 内 容 在 所 有 的 
CDN 节点 是 一 致 的 。 然 而 ， 内 容 提供 商 可 以 自行 设立 策略 和 使 用 一 些 启发 式 方法 来 
部 署 与 其 组 织 形式 相 适应 的 缓存 策略 。 第 一 种 情况 下 ， 内 容 提供 商 以 一 种 独特 的 方式 
确定 他 们 给 CDN 提供 商 的 缓存 策略 ， 该 方式 下 能 将 规则 集 传递 给 相关 缓存 ， 这 些 规 
则 告知 缓存 服务 器 如 何 通过 一 致 性 来 维持 内 容 的 时 效 性 。 第 二 种 情况 下 ， 内 容 提供 商 
可 以 应 用 一 些 启发 性 方法 而 不 是 开发 复杂 的 缓存 策略 。 通 过 这 种 机 制 ， 某 些 缓存 服务 
器 可 以 自 适应 地 通过 源 服务 器 中 内 容 的 更 改 频率 进行 自学 习 ， 并 相应 调节 自己 的 运行 
方式 。 


2.2.3 请 求 路 由 


一 个 请 求 路 由 系统 负责 将 客户 端的 请 求 路 由 到 合适 的 代理 服务 器 ， 它 包括 一 系列 
网 络 组 件 来 支持 单一 CDN 的 请 求 路 由 ， 并 将 用 户 请 求 指向 到 距离 其 最 近 的 副本 服务 
器 上 。 然 而 ， 离 用 户 最 近 的 服务 器 未 必 是 对 用 户 请 求 响应 最 快 的 代理 缓存 服务 器 。 
因此 ， 一 个 请 求 路 由 系统 使 用 一 组 度量 指标 如 网 络 邻近 性 、 用 户 感知 延 时 性 、 距 离 和 
副本 服务 器 负载 等 ， 将 用 户 请 求 转 到 最 近 的 能 提供 最 好 服务 的 代理 缓存 服务 器 上 。 内 
容 选 择 和 分 发 技术 ( 如 整体 复制 法 和 部 分 复制 法 ) 都 可 以 对 CDN 的 请 求 路 由 系统 产 
生 影 响 。 如 果 CDN 使 用 整体 复制 法 ， 那 么 请 求 路 由 系统 有 助 于 将 用 户 请 求 指向 代理 
缓存 服务 器 ， 因 为 它们 持 有 所 有 的 外 包 内 容 。 另 外 ， 如 果 采 用 部 分 复制 法 ， 那 么 请 求 
路 由 系统 会 以 如 下 方式 进行 设计 : 在 接收 到 用 户 请 求 后 ， 源 服务 器 传递 基本 内 容 ， 同 
时 代理 缓存 服务 器 传递 内 嵌 对 象 。CDN 中 的 请 求 路 由 系统 由 两 部 分 组 成 : 请 求 路 由 算 
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法 的 部 署 和 请 求 路 由 机 制 的 使 用 ” 。 一 个 请 求 路 由 算法 在 收 到 用 户 请 求 后 被 启动 ， 它 
确定 如 何 选择 边缘 服务 器 用 于 响应 特定 的 用 户 请 求 。 另 外 ， 一 个 请 求 路 由 机 制 是 一 种 通 
知 用 户 选择 的 方法 。 该 机 制 首先 启动 请 求 路 由 算法 ， 随 后 将 它 的 选择 结果 通知 用 户 。 

图 2. 10 提供 了 一 个 典型 CDN 环境 中 请 求 路 由 系统 的 高 层 示意 图 。 交 互 流 程 为 : 
(1) 用 户 通过 浏览 器 输入 URL， 向 内 容 提供 商 请 求 内 容 ， 用 户 的 请 求 被 指向 源 服务 
ae; (2) 当 源 服务 器 收 到 请 求 后 ， 它 只 提供 基本 内 容 (如 网 站 的 主页 ) ; (3) 对 于 需 
要 高 速 宽带 和 频繁 检索 的 内 容 CALORE AR — 最 新 内 容 、 导 航 条 、 广 告 条 等 ) ， 内 
容 提 供 商 的 源 服务 器 将 用 户 请 求 重 定向 至 CDN 提供 商 ; (4) 通过 恰当 的 选择 算法 ， 
CDN 提供 商 选 择 离 用 户 最 近 的 副本 服务 器 ， 用 于 提供 被 请 求 的 内 嵌 对 象 ，(5) 被 选 定 
的 副本 服务 器 通过 源 服务 器 得 到 内 艇 对 象 ， 响 应 用 户 请 求 ， 并 缓存 内 容 以 供 下 次 使 用 。 


副本 服务 器 E 
图 2.10 CDN 环境 中 的 请 求 路 由 





1. 请 求 路 由 算法 

请 求 路 由 机 制 使 用 的 算法 可 以 是 自 适 应 的 也 可 以 是 非 自 适应 的 〈 见 图 2. 11)。 在 
进行 内 容 分 发 时 ， 自 适应 算法 根据 当前 的 系统 状况 来 确定 缓存 服务 器 。 系 统 当前 状态 
可 以 来 自 对 某 些 信息 的 估计 ， 如 副本 服务 器 上 的 负载 或 选 定 网 络 连接 的 拥塞 等 。 非 自 
适应 的 请 求 路 由 算法 使 用 某 些 启发 式 方法 来 选择 缓存 服务 器 ， 而 不 考虑 当前 的 系统 状 
态 。 非 自 适应 算法 容易 实现 ， 而 自 适应 算法 则 较为 复杂 。 自 适应 算法 的 复杂 度 在 于 ,该 
算法 需要 改变 自身 行为 去 配合 某 种 持续 状态 。 非 自 适应 性 算法 在 启发 式 条 件 满足 的 情况 
下 运行 效率 较 高 。 另 外 ， 自 适应 算法 在 面 对 瞬 时 拥 骞 时 具有 较 高 的 系统 鲁 棱 性 "”。 

一 个 最 常见 的 非 自 适应 性 请 求 路 由 算法 的 简单 例子 是 轮 询 算法 ， 它 将 所 有 的 请 求 
分 配给 CDN 服务 器 并 试图 平衡 其 负载 5%; 。 该 算法 假定 ， 所 有 缓存 服务 器 都 具有 同样 
的 处 理 能 力 ， 并 且 任 意 一 台 都 能 服务 客户 请 求 。 这 样 的 简单 算法 对 于 所 有 副本 服务 器 
都 聚 在 一 起 时 非常 有 效 [%] 。 但 是 ， 该 算法 在 缓存 服务 器 呈现 松散 分 布 的 大 范围 分 布 
式 系统 中 性 能 一 般 。 因 为 在 这 种 情况 下 ， 算 法 并 不 考虑 副本 服务 器 间 的 距离 。 因 此 ， 
客户 端 请 求 可 能 会 被 转发 到 距离 更 远 的 副本 服务 器 ， 从 而 导致 算法 性 能 下 降 。 另 外 ， 
负载 均衡 的 目标 也 无 法 达到 ， 因 为 处 理 不 同 请 求 需要 完全 不 同 的 计算 成 本 。 
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在 另 一 个 非 自 适应 的 请 求 路 由 算法 中 ， 所 有 副本 服务 器 根据 加 载 在 自身 上 的 负载 
的 预测 值 进行 排序 。 该 预测 可 以 通过 迄今 为 止 该 服务 器 所 服务 过 的 请 求 数量 进行 估 
计 。 该 算法 考虑 到 了 客户 端 和 服务 器 之 间 的 距离 ， 同 时 客户 端 请 求 以 均衡 负载 的 方式 
被 转发 到 副本 服务 器 ， 因 为 算法 假定 副本 服务 器 负载 与 客户 端 和 服务 器 间 的 距离 是 对 
用 户 请 求 处 理 效果 影响 最 重要 的 因素 吕 ] 。 虽 然 Aggarwal 等 人 "已 经 发 现 采 用 这 种 算 
法 对 于 请 求 路 由 表现 良好 ， 但 是 客户 感知 到 的 系统 性 能 仍然 不 高 。 

还 有 一 些 令 人 感 兴趣 的 非 自 适应 请 求 路 由 算法 在 思科 公司 的 Distributed Director 中 
已 得 到 应 用 '”1 ， 其 中 一 个 算法 考虑 了 每 个 副本 服务 器 接收 到 的 用 户 请 求 的 百分比 ， 其 
思路 是 认为 接收 到 更 多 请 求 的 服务 器 的 性 能 是 更 好 的 。 因 此 ， 客 户 端 请 求 被 转向 性 能 更 
好 的 服务 器 ， 以 期 得 到 更 好 的 资源 利用 效率 。 另 一 种 算法 定义 了 服务 器 之 间 的 优先 级 ， 
指派 那些 优先 级 高 的 服务 器 去 服务 用 户 请 求 。DistributedDirector 也 支持 随机 地 将 请 求 分 
配 到 副本 服务 器 。 并 且 ， 某 些 其 他 非 自 适 应 性 算法 也 考虑 到 了 用 户 的 地 理 分 布 ， 并 能 够 
将 用 户 请 求 重 定向 到 附近 的 副本 服务 器 。 然 而 ， 这 些 算 法 表现 并 不 理想 ， 原 因 在 于 客户 
端 请 求 可 能 会 被 分 配 到 过 载 的 副本 服务 器 ， 导 致 客户 端 性 能 体验 的 恶化 。 

Karger “ AU?! 提出 了 一 个 请 求 路 由 算法 以 自 适应 地 应 对 热点 (hotspot) 问题 。 
该 算法 基于 内 容 的 URL 从 一 个 大 的 标识 符 空 间 中 计算 一 个 哈 希 函 数 刀 。 这 个 哈 希 函数 
被 用 于 将 用 户 请 求 高 效 地 路 由 到 一 个 包含 有 同一 空间 范围 内 所 有 缓存 服务 器 (也 就 
是 说 其 ID 属于 同一 空间 ) 的 逻辑 环 。 该 算法 规定 由 那个 大 于 刀 值 的 最 小 ID 号 的 缓存 
服务 器 负责 保存 被 请 求 的 数据 ， 并 将 客户 端 请 求 定 向 到 该 服务 器 。 该 算法 的 一 些 修改 
版 本 已 用 于 类 间 缓 存 内 容 “和 P2P 文件 共享 。 

在 GlobuleU? 使 用 的 一 种 自 适 
应 请 求 路 由 算法 中 ， 通 过 网 络 邻 
近 度 来 选择 距离 客户 端 最 近 的 服 
务 器 ”， 该 度量 基于 周期 性 更 新 ” 非 自 适应 性 自 适 应 性 
的 路 径 长 度 。Globule 使 用 的 度量 
估计 服务 是 被 动 式 的 ， 并 不 涉及 bd tt 
其 他 网 络 流量 。 然 而 ，Huffaker 等 人 "的 研究 表明 ， 距 离 度量 估计 的 过 程 并 不 精确 。 

Andrews 等 人 "和 Ardiaz 等 人 5 提出 了 一 种 基于 客户 端 一 服务 器 延 时 的 自 适 应 
请 求 路 由 算法 。 在 此 方法 中 ， 算 法 通过 客户 端 访问 日 志 或 被 动 的 服务 器 端 延 时 测量 ， 
来 决定 客户 端 请 求 需要 发 送 给 哪 一 台 副 本 服务 器 。 这 样 ， 客 户 端的 请 求 可 以 转发 到 具 
有 最 小 延 时 的 副本 服务 器 上 。 这 个 算法 非常 有 效 ， 因 为 它 考虑 到 延 时 因素 。 然 而 ， 这 
种 实现 方式 需要 维护 一 个 中 心 数据 库 来 管理 测量 数据 ， 因 而 会 限制 使 用 该 算法 的 系统 
的 可 拓展 性 。 

思科 的 DistributedDirector'™) 实现 了 一 种 自 适应 请 求 路 由 算法 。 该 算法 采用 三 种 度 
量 的 加 权 组 合 ， 即 AS 间距 、AS 内 距 和 端 到 端 延 时 。 尽 管 使 用 三 种 度量 后 提高 了 灵活 
HE, 但 计算 复杂 且 代 价 高 晶 。 另 外 ， 主 动 性 的 延 时 测量 引入 了 额外 的 网 络 流量 。 更 有 
其 者 ，DistributedDirector 的 组 件 与 副本 服务 器 相 分 离 ， 使 得 其 不 能 探测 服务 器 并 得 到 
服务 器 的 负载 信息 。 


请 求 路 由 算法 
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Akamai ^ 使 用 了 一 个 复杂 的 请 求 路 由 算法 ， 能 够 自 适应 地 处 理 瞬 时 拥塞 问题 。 
该 方法 使 用 了 多 种 度量 ， 如 副本 服务 器 负载 、 客 户 端 与 每 一 台 副 本 服务 器 负载 的 可 靠 
性 以 及 副本 服务 器 的 可 用 带宽 等 。 该 算法 为 Akamai 专 有 ， 故 算法 实现 细节 并 未 公开 。 
2. 请 求 路 由 机 制 
请 求 路 由 机 制 使 客户 端 清楚 如 何 通过 请 求 路 由 算法 选择 副本 服务 器 。 请 求 路 由 机 
制 的 分 类 可 以 按照 若干 标准 来 进行 ， 这 里 依据 的 是 对 请 求 的 处 理 ， 分 为 全 局 服务 器 负 
载 均衡 (CSLB), 、 基 于 DNS 的 请 求 路 由 、HTTP 重 定向 、URL 改写 、 任 播 anycast- 
ing), CDN 对 等 ， 如 图 2. 12 所 示 。 


全 局 感知 
全 局 服务 器 负载 | 
HAE (GSLB) 智能 管理 DNS 


基于 DNS 的 请 求 路 由 


请 求 路 由 


机 制 URL 改 写 一 一 | — ill 


中 心 化 目录 模型 
分 布 式 哈 希 表 
海量 请 求 模型 
文档 路 由 模型 


CDN 对 等 


图 2. 12 请 求 路 由 机 制 的 分 类 


在 GSLB' 和 4 方法 中 ,提供 服务 的 节点 将 内 容 发 送 到 端 用 户 ， 服 务 节点 由 一 个 具有 
GSLB 功能 的 Web 交换 机 和 全 球 分 布 的 大 量 Web 服务 器 组 成 。 该 方法 定义 的 服务 节点 
具有 两 个 新 的 能 力 ， 使 其 能 支持 全 局 服务 器 负载 均衡 。 第 一 个 能 力 是 全 局 感知 ， 第 二 
个 是 智能 管理 DNSU? 。 在 本 地 服务 器 的 负载 均衡 处 理 中 ， 每 一 个 服务 节点 都 可 获知 
与 其 直 连 的 Web 服务 器 的 状态 和 性 能 信息 。 在 GLSB 中 ， 一 个 服务 节点 获知 其 他 服务 
节点 的 信息 ， 并 将 其 虚拟 IP 地 址 存储 在 它 的 服务 器 列表 中 。 因 此 ， 组 成 每 一 个 服务 
节点 的 Web 交换 机 是 全 局 感知 的 ， 每 一 个 服务 节点 都 知道 其 他 服务 节点 的 地 址 ， 并 
在 GSLB 配置 中 通过 交换 机 彼此 交换 性 能 信息 。 为 了 利用 这 些 全 局 信息 ，GSLB 交换 
机 充当 某 些 特定 域 中 的 智能 管理 DNS。GSLB 的 优势 在 于 ， 因 为 服务 节点 可 以 互相 感 
知 ， 每 一 个 GSLB Switch 均 可 为 任何 请 求 选择 最 优 的 代理 缓存 服务 器 。 因 此 ， 该 方法 
方便 了 服务 器 的 选择 ， 不 仅仅 可 以 从 本 地 相连 的 实际 服务 器 池 中 选择 ， 还 能 从 远程 的 
服务 节点 中 选择 。GSLB 的 另外 一 个 优势 在 于 ， 网 络 管理 员 能 够 在 不 需要 额外 添加 网 
络 设备 的 情况 下 增加 网 络 的 GSLB 能 力 。GSLB 的 不 足 是 需要 手动 配置 服务 节点 来 使 


得 它们 能 够 与 CSLB 实现 性 能 的 匹配 。 
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在 基于 DNS 的 请 求 路 由 方法 中 ， 内 容 分 发 服务 通过 修改 DNS 服务 器 来 实现 代理 
缓存 服务 器 的 符号 名 与 其 耳 地 址 之 间 的 映射 。 映 射 被 用 于 “整体 复制 ”模式 下 的 内 
容 选 择 和 分 发 。 在 基于 DNS 的 请 求 路 由 中 ， 一 个 域名 对 应 多 个 IP 地 址 。 当 接收 到 一 
个 端 用 户 的 内 容 请 求 时， 服务 提 供 商 的 DNS 服务 器 返回 拥有 被 请 求 对象 副 本 的 那些 
服务 器 的 IP 地址 ， 客 户 端的 DNS 解析 器 从 中 选择 一 个 服务 器 。 为 了 判断 哪 一 个 服务 
器 合适 ， 解 析 器 需要 分 配 一 个 探测 器 给 服务 器 ， 通 过 测量 这 些 服务 器 到 探测 器 的 响应 
时 间 来 确定 具有 的 服务 。 它 也 可 根据 收集 到 的 历史 数据 ， 如 客户 端 对 服务 器 的 访问 情 
况 来 选择 服务 器 。 采 用 “整体 复制 ”和 “部 分 复制 ”的 CDN 提供 商都 使 用 DNS 重 定 
向 。 基 于 DNS 的 请 求 路 由 系统 的 性 能 情况 已 在 很 多 文献 中 进行 了 研究 5 I 99 xx 
种 方法 的 优势 在 于 透明 ， 因 为 对 服务 的 调用 是 通过 DNS 域名 而 非 IP 地 址 。 基 于 DNS 
的 方法 之 所 以 得 到 广泛 应 用 ， 原 因 在 于 简单 易 用 ， 并 且 与 任何 实际 的 被 复制 的 服务 相 
独立 ， 它 被 能 入 到 域名 解析 服务 中 ， 所 以 可 被 任何 互联 网 应 用 程序 使 用 品 ] 。 另 外 ， 
提供 目录 服务 的 DNS 到 处 可 见 ， 也 方便 了 请 求 路 由 的 实现 。 该 方法 的 缺点 在 于 增加 
了 网 络 延 时 ， 因 为 它 延长 了 DNS 查找 时 间 。CDN 管理 员 一 般 通 过 将 CDN 的 DNS 分 割 
为 两 层 (低层 DNS 和 高 层 DNS) 来 解决 这 个 问题 ”。 另 外 一 个 局 限 是 DNS 提供 的 是 
客户 端 当 地 DNS (LDNS) 的 人 地址 ， 并 不 是 客户 端 本 身 的 IP 地 址 。 客 户 端 被 管理 
员 假 定位 于 当地 DNS 附近 ， 当 基于 DNS 的 服务 器 选择 方法 被 用 于 选择 邻近 服务 器 时 ， 
决策 是 由 域名 服务 器 而 不 是 客户 端 来 进行 。 因 此 ， 当 客户 端 和 域名 服务 器 不 在 一 起 
时 ， 基 于 DNS 的 方法 会 产生 性 能 低下 的 决策 。 更 重要 的 是 ，DNS 不 能 用 于 控制 所 有 
的 访问 请 求 ， 因 为 对 DNS 数据 的 缓存 同时 在 ISP 和 客户 端 两 个 层面 上 进行 。 事 实 上 ， 
在 很 多 实例 中 DNS 仅 能 够 控制 至 多 5% 的 请 求 ”。 更 有 其 者 ， 因 为 客户 端 并 不 连接 
到 为 其 提供 内 容 服务 的 实际 域名 ， 这 使 得 一 旦 指定 的 代理 缓存 服务 器 失效 ， 就 没有 任 
何其 他 服务 器 来 为 客户 端的 请 求 服务 。 因 此 ， 在 网 络 或 服务 器 状况 不 断 变化 的 情况 
下 ， 为 了 保证 实时 响应 ， 基 于 DNS 的 方法 必须 避免 在 客户 端 进行 缓存 或 决策 。 

HTTP 重 定向 技术 通过 HTTP 头 来 传播 副本 服务 器 集 的 信息 。HTTP 允许 一 个 网 络 服 
务 器 通过 一 种 特殊 报 文 来 响应 客户 端 请 求 ， 该 报 文告 知 用 户 重新 发 送 请 求 到 另外 的 服务 
ato HTTP 重 定向 可 用 于 整体 复制 和 部 分 复制 的 内 容 选 择 和 分 发 。 该 机 制 可 用 于 构建 一 
种 特殊 的 网 络 服务 器 ， 以 接收 用 户 的 请 求 ， 并 选择 副本 服务 器 和 将 用 户 重 定向 到 这 些 服 
务 器 上 。 这 种 机 制 需 要 对 网 络 服务 器 和 客户 端 进行 一 些 修改 以 处 理 额外 的 报 文 头 。 该 方 
法 的 主要 优点 在 于 可 拓展 性 和 简易 性 ， 而 且 对 复制 过 程 可 以 进行 精细 粒度 的 管理 ， 因 为 
每 一 个 网 页 可 以 被 视 为 颗粒 '” 。HTTP 重 定向 技术 最 大 的 缺点 在 于 缺乏 透明 度 。 更 重要 
的 是 ， 它 在 HTTP 和 处 理 的 请 求 上 引入 了 额外 的 报 文 往 返 操作 ， 因 此 系统 开销 非常 大 。 

尽管 大 多 数 CDN 系统 使 用 基于 DNS 的 路 由 机 制 ， 但 也 有 一 些 系统 使 用 URL 的 改 
写 或 者 超 链接 ， 主 要 用 于 部 分 复制 的 内 容 选 择 和 分 发 ， 其 中 内 舱 对 象 应 客户 端的 请 求 
而 发 送 。 在 此 方法 中 ， 源 服务 器 对 动态 生成 的 页 面 的 URL 链接 进行 改写 ， 从 而 将 客 
户 端 重 定向 到 不 同 的 代理 缓存 服务 器 。 例 如 ， 一 个 网 页 包含 HTML 文件 和 一 些 内 嵌 对 
象 ， 网 页 服务 器 会 修改 内 嵌 对 象 的 索引 列表 ， 使 客户 端 能 够 通过 最 优 的 代理 缓存 服务 
器 获取 这 些 内 容 。 为 了 使 该 过 程 自动 化 ，CDN 使 用 特殊 脚本 来 透明 地 解析 网 页 的 内 
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容 和 替换 内 嵌 对 象 的 URL' 3 。URL 的 改写 可 以 是 先 验 式 也 可 以 是 反应 式 的 。 在 先 验 
式 的 URL 改写 中 ，HTML ERP AHORA URL 在 内 容 被 加 载 到 源 服务 器 之 前 生成 。 
反应 式 方法 在 客户 端 请 求 到 达 源 服务 器 后 才 进 行 HTML AE AR URL 的 改写 操作 。 
URL 改写 的 主要 优点 是 客户 端 不 必 受 限于 一 台 代理 缓存 服务 器 ， 因 为 改写 的 URL 包 
含 了 指向 一 组 代理 缓存 服务 器 的 DNS 名 称 。 另 外 ， 通 过 这 种 方式 也 能 达到 更 优 的 粒 
度 ， 因 为 内 嵌 对 象 可 以 被 认为 是 颗粒 。 该 方法 的 缺点 是 URL 解析 带 来 的 延 时 以 及 因 
为 引入 一 个 径 内 因素 可 能 导致 的 瓶颈 。 另 外 一 个 劣势 是 那些 访问 索引 被 改 为 指向 邻近 
代理 缓存 服务 器 (而 非 源 服务 器 ) 的 内 容 是 不 能 缓存 的 。 

任 播 法 可 以 被 分 为 人 P 任 播 和 应 用 层 任 播 。 人 P 任 播 由 Partridge 等 人 中 提出， 假定 同 
— IP 地址 被 指派 到 一 组 主机 ， 每 一 个 亿 路 由 器 保持 路 由 表 中 一 条 从 主机 到 路 由 器 的 最 
短路 径 。 因 此 ， 不 同人 p 路 由 器 管理 着 通 向 不 同 主机 (具有 相同 卫 地 址 ) 的 路 径 。 了 4E 
播 适合 请 求 路 由 和 服务 定位 ， 可 以 在 潜在 的 异 构 平台 上 实现 全 网 范围 的 服务 器 复制 。 卫 
任 播 的 缺点 在 于 某 些 TP 地 址 空间 被 分 给 了 任 播 地 址 。Fei 等 人 四 提出 了 一 种 应 用 层 任 
播 机 制 ， 其 中 服务 包含 了 一 组 任 播 解析 器 ， 能 进行 任 播 域名 到 IP 地 址 的 映射 。 用 户 与 
任 播 解析 器 进行 交互 产生 任 播 请 求 ， 解 析 器 处 理 请 求 返 回 任 播 的 响应 结果 。 一 个 度量 数 
据 库 与 每 一 个 任 播 解析 器 相连 ， 包 含 副 本 服务 器 的 性 能 数据 。 服 务 器 的 性 能 评估 涉及 服 
务 器 的 负载 和 处 理 请 求 的 能 力 ， 性 能 测量 所 带 来 的 系统 开销 被 保持 在 一 个 可 管理 水 平 
上 。 人 性 能 数据 可 用 于 从 一 个 服务 器 组 中 ， 根 据 用 户 特定 性 能 要 求 来 选择 某 一 服务 器 。 应 
用 层 任 播 的 优势 在 于 灵活 性 ， 而 缺点 是 部 署 对 于 请 求 路 由 的 任 播 机 制 时 需要 对 服务 器 和 
客户 端 都 进行 修改 ， 因 此 对 于 大 量 服务 器 和 客户 端 而 言 增加 了 成 本 。 

对 等 的 内 容 网 络 通过 主机 之 间 的 对 称 连接 形成 ， 形 成 对 等 CDN 之 间 可 以 代为 转 
发 彼此 的 内 容 。 因 此 ， 通 过 CDN 服务 器 及 其 附近 的 代理 服务 器 ， 一 个 CDN 可 以 扩展 
自己 的 范围 到 更 大 的 用 户 群 中 。 一 个 内 容 提供 商 一 般 只 与 一 个 CDN 有 协议 ， 每 一 个 
CDN 再 代表 内 容 提供 商 与 其 他 对 等 CDN 互联 "9 。 对 等 CDN 更 加 具有 容错 性 ， 因 为 
所 有 必要 的 信息 检索 网 络 都 可 以 通过 对 等 成 员 得 到 ， 而 不 必 依 靠 像 传 统 CDN 那样 的 
复杂 结构 。 为 了 定位 CDN 对 等 成 员 的 内 容 ， 可 以 使 用 一 种 中 心 化 的 目录 模型 或 分 布 
式 哈 希 表 (DHT), ， 也 可 以 使 用 洪 泛 请 求 模型 或 文档 路 由 模型 *“]。 

在 中 心 化 的 目录 模型 中 ， 所 有 对 等 节点 将 其 持 有 的 共享 内 容 登 记 在 中 心目 录 中 ， 
并 可 以 访问 该 目录 。 当 目录 收 到 请 求 时 ， 它 返回 持 有 被 请 求 内 容 的 节点 信息 。 当 有 不 
止 一 个 节点 可 以 服务 请 求 时 ， 最 优 的 节点 的 选择 可 以 根据 网 络 距离 、 最 大 带宽 、 最 小 
拥塞 和 最 高 容量 等 信息 产生 。 收 到 目录 发 出 的 响应 后 ， 发 出 内 容 请 求 的 节点 从 指定 的 
最 优 节点 获取 内 容 。 该 方法 的 缺陷 在 于 ， 中 心 化 的 目录 易 出 现 单 点 失效 问题 。 另 外 ， 
基于 中 心目 录 的 系统 ， 其 可 拓展 性 受 目录 容量 的 限制 。Archic 和 WAIS 是 中 心 化 
目录 模型 的 典型 例子 ， 用 于 跨 系统 的 FTP 文件 传输 。 

在 使 用 DHT 的 系统 中 ， 使 用 哈 希 键 值 对 分 布 式 节点 进行 索引 ， 因 此 持 有 被 请 求 
内 容 的 节点 可 通过 查询 和 查找 函数 得 到 "” 。 使 用 DHT 的 例子 是 Chord ”， 其 优势 在 
于 一 个 过 载 的 节点 能 够 将 自身 的 负载 转移 到 负载 较 轻 的 节点 ， 以 便 达 到 负载 均衡 ””。 
在 海量 请 求 模型 中 ,来 自 节点 的 请 求 被 广播 给 与 其 直 连 的 其 他 节点 ， 这 些 节点 再 进 一 
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步 将 报 文 转发 给 与 其 直 连 的 节点 ， 该 过 程 一 直 持 续 到 请 求 被 响应 或 达到 某 种 限制 为 
止 。 该 方法 的 缺陷 在 于 它 产生 了 额外 的 网 络 流量 ， 因 此 对 带宽 的 要 求 大 大 增加 。 因 
此 ， 该 方法 受制 于 可 拓展 性 和 网 络 规模 。Gnutella”” 是 一 个 使 用 海量 请 求 模型 系 
统 的 例子 。 在 文档 路 由 模型 中 ， 经 过 授权 的 节点 得 到 被 请 求 的 内 容 。 该 模型 中 ， 每 个 
节点 负责 提供 一 定 范围 的 文件 ID ， 可 以 部 分 地 提供 被 请 求 的 内 容 “' 。 当 某 个 节点 需 
要 得 到 某 个 文件 时 ， 它 便 发 送 包含 文件 ID 的 请 求 。 请 求 被 转发 给 含有 最 接近 文件 ID 
号 的 节点 ,一 旦 文件 被 定位 ， 该 文件 就 被 传输 到 发 出 请 求 的 节点 。 该 方法 的 主要 优点 
是 其 算法 复杂 度 为 0(logn)， 能 在 有 限 步 内 完成 全 局 的 搜索 ， 并 表现 出 良好 的 性 能 ， 
且 其 优良 的 扩展 性 使 网 络 规模 可 以 非常 庞大 。 


2.2.4 性 能 测量 


CDN 能 够 测量 其 服务 客户 端 请 求 的 特定 内 容 和 (R) 服务 的 能 力 。 一 般 而 言 ， 
内 容 提供 商 主要 使 用 5 种 指标 来 评估 CDN 的 性 能 Po | fad, 

(1) 缓存 命中 率 

该 指标 定义 为 被 缓存 文档 的 数量 与 被 请 求 文档 总 数 的 比率 。 一 个 高 的 缓存 命中 率 
表明 CDN 使 用 了 高 效 的 缓存 技术 。 

(2) 保留 带宽 

该 指标 定义 为 源 服务 器 使 用 的 带宽 ， 以 字 节 为 单位 ， 通 过 检测 源 服务 器 获得 。 

(3) 延 时 

该 指标 指 用 户 感知 的 响应 时 间 。 延 时 的 下 降 表明 源 服务 器 保留 了 较 少 的 带宽 。 

(4) 代理 缓存 服务 器 利用 率 

该 指标 指 代理 缓存 服务 器 持续 繁忙 的 时 间 占 比 ， 用 于 计算 CPU 负载 、 服 务 请 求 
的 数量 和 存储 1/0 的 利用 率 。 

(5) 可 靠 性 

CDN 的 可 靠 性 是 根据 丢 包 情况 来 判断 的 ， 高 可 靠 性 表明 CDN 丢 包 较 少 ， 并 且 对 
于 客户 端 来 说 可 用 性 较 高 。 

性 能 测量 可 以 基于 系统 内 部 的 性 能 评定 ， 也 可 以 从 用 户 的 角度 进行 。 一 个 CDN 
提供 商 本 身 的 性 能 测量 可 能 没有 什么 实际 意义 ， 因 为 对 于 某 一 特定 网 址 该 CDN 性 能 
可 能 表现 良好 ， 而 对 其 他 站 点 而 言 则 可 能 一 般 。 为 了 确保 可 靠 的 性 能 测量 ， 一 个 
CDN 的 性 能 可 以 通过 独立 的 第 三 方 来 测试 完成 ， 如 Keynote 系统 或 Giga Information 
Group? 。 性 能 测量 的 分 类 如 图 2. 13 所 示 。 

1. 内 部 测量 内 部 测量 

CDN 服务 器 可 以 收集 统计 数据 ， 用 于 得 到 网 站 "-— n 
的 端 对 端 性 能 。 除 此 之 外 ， 可 以 在 整个 网 络 中 部 团 
探测 器 (硬件 和 软件 ) ， 通 过 分 析 探 测 器 采集 到 的 。 ”图 2.13 性 能 测量 的 分 类 
信息 与 服务 器 日 志 及 缓存 之 间 的 相关 性 ， 就 可 以 测 
量 出 端 到 端的 性 能 。 
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2. 外 部 测量 

除 内 部 性 能 测量 外 ， 通 过 独立 的 第 三 方 性 能 测量 可 以 从 CDN 用 户 的 角度 获得 系 
统 的 实际 性 能 。 这 个 过 程 相当 有 效 ， 因 为 独立 的 性 能 测试 公司 可 以 提供 基准 测量 网 
络 ， 该 测量 网 络 由 分 布 在 若干 城市 骨干 网 中 按 一 定 策略 分 布 的 测试 计算 机 互联 而 成。 
这 些 计算 机 从 终端 用 户 的 角度 ， 使 用 一 些 关键 的 服务 性 能 指标 ， 来 评定 一 个 特定 站 点 
的 性 能 表现 5 。 

3. 用 于 性 能 测量 的 网 络 信息 获取 

对 于 内 部 和 外 部 的 性 能 测试 ， 可 以 使 用 基于 不 同 参 数 的 网 络 统计 信息 获取 技术 ， 
包括 网 络 探测 、 流 量 监控 和 代理 缓存 服务 器 反馈 。 网 络 统计 获取 过 程 中 典型 的 参数 包 
括 地 域 邻近 度 、 网 络 邻近 度 、 延 时 、 服 务 器 负 eum 
载 和 服务 器 整体 性 能 。 图 2. 14 显示 了 CDN fi Sei anne 
用 的 网 络 统计 信息 获取 技术 。 mae [— m5 

网 络 探测 是 一 种 测量 技术 ， 用 于 检测 那些 ne 
可 能 发 出 请 求 的 实体 ， 以 期 从 一 个 或 多 个 代理 图 2 14 网 络 统计 信息 获取 技术 
缓存 服务 器 处 获取 一 种 或 多 种 测量 指标 。 网 络 探测 可 用 于 基于 POP 的 协作 CDN 中 ， 其 
中 代理 缓存 服务 器 不 由 单 _ CDN 提供 商 控制 。ICMP ECHO 报 文 就 是 此 类 探测 技术 的 一 
个 例子 ， 该 报 文 被 一 个 或 多 个 代理 缓存 服务 器 周期 性 地 发 到 潜在 请 求 方 。 由 于 某 些 原 
因 ， 主 动 探测 技术 在 某 些 情况 下 并 不 适用 ， 而 且 在 有 些 方面 具有 局 限 性 。 该 技术 引入 了 
额外 的 网 络 延 时 ， 可 能 对 小 型 网 络 的 影响 较 大 。 另 外 ， 针 对 一 个 实体 执行 多 个 探测 器 的 
操作 经 常 引发 冲突 检测 ， 导 致 用 户 的 不 满 3 。 探 测 技术 有 时 也 会 导致 不 准确 的 测量 结 
果 。 因 为 担心 遭 到 分 布 式 拒绝 服务 攻击 (DDoS) ，ICMP 流量 有 可 能 被 忽略 或 被 变更 优 
” 先 次 序 。Freedman 等 9 提出 的 分 布 式 任 播 系 统 表明 ， 如 果 使 用 高 随机 性 的 端口 ，ICMP 
探测 器 和 TCP 探测 器 经 常 被 防火 墙 拒绝 或 者 被 标记 为 非法 的 端口 扫描 。 

流量 监控 是 一 种 通过 监控 客户 端 和 代理 缓存 服务 器 之 间 的 流量 来 得 知 确切 性 能 测 
量 数据 的 检测 方法 。 一 旦 客户 端 建立 连接 ， 传 输 过 程 的 实际 性 能 将 被 测量 。 测 量 数据 
反馈 到 请 求 路 由 系统 ， 一 个 例子 是 通过 测量 TCP 的 性 能 来 获取 从 客户 端 到 代理 缓存 
服务 器 的 丢 包 情况 或 者 用 户 感知 延 时 的 情况 。 延 时 是 最 简单 也 是 最 常用 的 距离 测量 指 
标 ， 可 通过 客户 端 到 代理 缓存 服务 器 之 间 路 由 路 径 的 包 传递 ( 即 流量 情况 进行 估 
ib. 测量 估计 系统 (如 IDMapscsl ) 在 整个 互联 网 范围 内 测量 和 传播 延 时 和 带宽 等 距 
离 信息 。 该 系统 考虑 两 类 及 时 性 的 距离 信息 ， 即 负载 敏感 和 “原始 ”信息 (也 就 是 
说 ， 距 离 信 息 是 在 不 考虑 网 络 中 负载 情况 下 获得 的 ) 。 对 这 些 信息 进行 估计 时 ， 以 某 
种 时 间 更 新 频率 进行 流量 监控 ， 更 新 频率 可 以 按 天 计 ， 如 有 必要 也 可 以 小 时 计 。 

代理 缓存 服务 器 的 反馈 信息 可 以 通过 周期 性 的 探测 得 到 ， 方 式 是 发 送 与 特定 应 用 相 
关 的 请 求 〔 如 HTTP) 以 及 采取 相关 的 测量 手段 。 反 馈 信息 也 可 通过 代理 缓存 服务 器 中 
部 署 的 代理 得 到 。 这 些 代理 可 得 到 关于 彼此 节点 的 一 系列 测量 信息 。 反 馈 信息 的 获得 手 
段 可 以 是 静态 的 也 可 以 是 动态 的 。 静 态 方法 通过 选择 路 由 来 最 小 化 路 径 中 的 跳 数 或 者 通 
过 优化 其 他 静态 参数 得 到 。 动 态 探测 需要 计算 往返 时 间或 实时 的 QoS BAB”, 

图 2.15 列 出 了 CDN 在 测量 网 络 和 系统 性 能 时 使 用 的 不 同 指标 。 地 域 邻近 度 是 一 
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种 判断 特定 区 域内 用 户 位 置 的 技术 ， 常 用 于 将 特 


定 区 域内 的 所 有 用 户 重 定向 到 同一 个 接 入 点 “a 
(POP)。 这 种 网 络 邻 近 度 的 测量 一 般 通 过 探测 ge | 一 于 

BGP 路 由 表 得 到 。 端 用 户 感知 的 延 时 也 是 一 个 有 平均 带宽 

用 的 指标 ， 可 用 于 为 用 户 选择 合适 的 代理 缓存 服 ders 
务 器 。 一 条 网 络 路 径 的 丢 包 信息 也 是 一 种 指标 ， 服务 器 负载 
用 于 选择 具有 最 小 错误 率 的 路 径 。 平 均 带 宽 、 启 。。 eo 15 用 于 测量 网 络 和 
动 时 间 和 帧 率 等 指标 都 可 用 于 选择 流 媒体 分 发 的 系统 性 能 的 指标 


最 优 路 径 。 服 务 器 负载 状态 可 通过 计算 CPU fA 
载 、 网 络 接口 负载 、 活 动 连接 和 存储 LO 负载 等 相关 信息 得 到 。 服 务 器 负载 状态 指标 
用 于 选择 具有 最 小 累积 负载 的 服务 器 。 

4. 通过 仿真 进行 性 能 测量 

除了 内 部 和 外 部 性 能 测量 外 ， 也 可 使 用 仿真 工具 来 分 析 一 个 CDN 的 性 能 。 一 些 
研究 人 员 使 用 了 一 些 真 实 平台 如 PlanetLab”) 等 进行 他 们 自己 设计 的 CDN 策略 实验 。 
通过 软件 实现 的 CDN 仿真 器 对 于 研究 人 员 开 发 、 测 试 和 诊断 CDN 的 性 能 来 说 非常 有 
用 。 商 业 CDN 的 专 有 特性 ， 使 得 访问 真实 CDN 的 信息 和 日 志 并 不 容易 。 在 实验 过 程 
中 无 须 引 入 复杂 的 硬件 设备 。 因 此 仿真 就 显得 经 济 实惠 ， 另 外 ， 仿 真 也 非常 灵活 ， 因 
为 在 仿真 实验 中 可 以 模拟 任何 带宽 和 传输 延 时 的 连接 ， 也 可 以 模拟 出 任意 队列 大 小 的 
路 由 器 和 相关 排队 管理 技术 。 一 个 虚拟 化 的 网 络 环境 避免 了 真实 网 络 环境 中 研究 人 员 
不 可 避免 的 不 可 控 因 素 ， 如 额外 的 流量 等 。 因 此 ， 仿 真 结果 是 可 重 现 的 ， 也 容易 进行 
分 析 。 目 前 ,已 有 多 种 网 络 仿 真 器 “可 用 于 模拟 一 个 CDN 的 性 能 测量 。 此 外 ， 还 有 
一 些 特殊 的 CDN 仿真 系统 ”"””“'"”" ， 可 供 研究 团体 和 CDN 开发 者 以 一 种 相当 真实 
的 方式 来 试验 他 们 自己 的 策略 和 测量 系统 性 能 。 然 而 ， 如 果 CDN 系统 不 考虑 诸多 关 
键 因素 ， 如 真实 网 络 中 经 常 遇见 的 问题 (瓶颈 问题 或 遍历 节点 数 ) TCP/IP 网 络 架 构 ， 
那么 通过 仿真 得 到 的 结果 也 可 能 具有 误导 性 。 


2.3 分 类 法 到 代表 性 CDN 的 映射 


本 节 将 提出 的 分 类 法 对 应 到 一 些 有 代表 性 的 CDN 中 ， 这些 CDN 已 经 在 第 1 章 进 
行 了 概述 。 在 对 现 有 系统 进行 分 类 的 同时 ， 本 节 还 提供 了 对 这 些 系统 的 相关 见解 和 评 
估 。 通 过 分 类 法 对 CDN 进行 分 析 ， 反 过 来 也 验证 了 分 类 法 的 有 效 性 和 适用 性 。 


2.3.1 基于 CDN 构成 的 分 类 


表 2. 1 给 出 了 基于 CDN 构成 分 类 若干 代表 性 CDN 的 资料 。 如 表 中 所 示 ， 现 有 大 
多 数 CDN 在 组 网 时 都 使 用 覆盖 法 ， 也 有 使 用 网 络 法 或 两 者 兼 具 。 无 论 覆 盖 法 还 是 网 
络 法 ， 在 Akamai 和 Mirror Image 等 商业 CDN 中 都 比较 常见 。 当 CDN 提供 商 使 用 以 上 
两 者 的 组 合 来 组 建 CDN 时 ， 可 使 用 一 个 网 络 组 件 将 HTTP 请 求 重 定向 到 邻近 的 实现 
特定 应 用 的 代理 缓存 服务 器 。 
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学 术 CDN 通过 使 用 覆盖 法 和 PAP 技术 建立 。 然 而 ， 这 些 CDN 在 覆盖 的 建立 和 部 
署 方式 上 各 不 相同 。 例 如 ，CoDeeN 的 覆盖 使 用 了 “开放 式 ” 的 代理 服务 器 ， 而 Coral 
的 覆盖 (包括 协作 HTTP 代理 服务 器 和 一 个 DNS 服务 器 网 络 ) 依靠 其 下 的 索引 设施 
& y, Globule 的 覆盖 由 端 用 户 节 点 组 成 。 

在 覆盖 法 中 ， 常 见 的 关系 为 客户 端 一 代理 缓存 服务 器 一 源 服务 器 和 网 络 组件 一 组 
存 代理 服务 器 。 代 理 服务 器 一 代理 服务 器 的 关系 在 CDN 中 也 很 常见 ， 代 理 服务 器 间 
关系 支持 缓存 服务 器 间 的 交互 。 当 使 用 网 络 法 时 ，CDN 依赖 于 网 络 组 件 的 交互 ， 在 
通过 预 设 策略 放置 的 网 络 组 件 上 部 署 请 求 路 由 逻辑 来 提供 服务 。 履 盖 法 优 于 网 络 法 的 
原因 在 于 新 的 服务 集成 和 简化 的 网 络 设施 管 理 。 对 于 覆盖 法 而 言 ， 提 供 一 个 新 服务 就 
像 在 CDN 服务 器 中 加 入 新 代码 一 样 简单 。 

CDN 使 用 源 服 务 器 和 副本 服务 器 进行 内 容 分 发 。 大 多 数 副本 服务 器 都 作为 Web 
服务 器 来 提供 Web 内 容 服务 。 某 些 CDN 如 Akamai, EdgeStream, Limelight Networks 
和 Mirror Image 等 ， 将 其 副本 服务 器 作为 多 媒体 服务 器 来 分 发 流 媒 体 和 视频 托管 服务 。 
副本 服务 器 也 可 以 用 于 提供 缓存 、 大 文件 传输 、 报 告 和 DNS 等 服务 。 在 学 术 CDN 
中 ， 代 理 / 副 本 服务 器 可 以 出 于 不 同 的 目的 进行 配置 。 例 如 ， 每 一 个 CoDeeN 节点 都 
能 用 做 一 个 前 向 、 反 向 或 重 定向 代理 服务 器 。Coral 代理 服务 器 之 间 彼 此 协作 ， 而 
Globule 节点 可 以 作为 源 服务 器 、 副 本 服务 器 或 备份 服务 器 使 用 。 

从 表 2. 1 中 可 以 看 出 ， 大 多 数 CDN 网 络 的 目标 还 是 用 于 提供 特定 内 容 。 因 为 服务 
和 内 容 的 差异 ， 需 要 CDN 具备 与 特定 应 用 相关 的 特点 、 结 构 和 技术 。 大 多 数 CDN DUE 
供 静 态 内 容 ， 少 数 CDN 提供 流 媒 体 、 广 播 和 其 他 服务 。 对 于 商业 CDN 而 言 ， 其 目的 是 
通过 内 容 和 (R) 服务 分 发 来 盘 利 。 然 而 学 术 CDN 的 目的 却 各 不 相同 。 例 如 ，CoDeeN 
提供 静态 内 容 的 目的 是 向 其 用 户 访 问 大 多 数 网 站 时 提供 更 好 的 性 能 ; Coral 的 目的 在 于 
提高 用 户 在 访问 大 多 数 Web 站 点 时 的 性 能 体验 ; Globule 力图 提升 用 户 访问 Web 站 点 的 
性 能 体验 和 可 用 性 ， 以 及 在 某 种 程度 上 应 对 瞬时 拥塞 和 Slashdot 效应 的 能 力 。 


2.3.2 基于 内 容 分 发 和 管理 的 分 类 


表 2.2 中 给 出 了 内 容 分 发 和 管理 分 类 法 与 代表 性 的 CDN 之 间 的 映射 关系 。 大 多 数 
CDN 支持 部 分 复制 方式 下 的 内 容 分 发 ， 有 的 CDN 也 同时 支持 整体 复制 和 部 分 复制 。 
CDN 提供 商 倾向 于 使 用 部 分 复制 的 内 容 分 发 ， 因 为 这 样 做 能 够 降低 源 服务 器 的 负载 以 
及 相应 的 设施 成 本 。 另 外 ， 因 为 内 竺 型 内 容 的 非 频繁 变化 性 ， 部 分 复制 的 方法 要 比 整 体 
复制 的 性 能 更 好 。 仅 仅 一 小 部 分 CDN (如 Akamai, Mirror Image 和 Coral 等 ) 支持 内 容 
的 聚 类 技术 ， 其 他 CDN 的 内 容 分 发 设施 架构 并 没有 显示 其 是 否 使 用 了 内 容 聚 类 技术 。 
Akamai 和 Coral 通过 用 户 会 话 期 进行 内 容 聚 类 ， 此 方法 的 有 效 之 处 是 有 助 于 辨识 相似 浏 
览 模式 的 用 户 群 和 含有 相关 内 容 信 息 的 那些 页 面 。 唯 一 使 用 URL 进行 内 容 聚 类 的 是 
Mirror Image， 但 是 基于 URL 的 方法 并 非 主流 ， 原 因 在 于 该 方法 受 限于 其 部 署 的 复杂 性 。 

通过 表 2. 2 能 够 清晰 地 看 出 ， 大 多 数 覆 盖 大 范围 地 域 的 代表 性 CDN 都 使 用 多 ISP 
法 ， 以 在 众多 全 球 性 ISP 的 接 入 点 处 放置 大 量 代理 缓存 服务 器 。 商 业 CDN (如 Aka- 
mai, Limelight Networks 和 Mirror Image) 和 学 术 CDN (如 Coral * 和 CoDeeN) 均 使 用 
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多 ISP 法 。 因 为 单 ISP 法 具有 这 样 的 缺陷 ， 即 代理 缓存 服务 器 相距 较 远 而 终端 用 户 之 
间 则 相对 较 近 。 然 而 ， 多 ISP 法 中 部 署 和 管理 系统 以 及 建 网 的 费用 、 管 理 成 本 和 复杂 
度 都 要 更 高 。 当 然 ， 对 于 那些 具有 高 流量 的 站 点 ， 以 上 问题 可 以 不 用 考虑 。 相 对 于 单 
ISP 法 ， 多 ISP 法 表现 更 佳 的 原因 是 单 ISP 法 只 适用 于 低 到 中 等 流量 的 站 点 。 


表 2.2 内 容 分 发 和 管理 分 类 映射 示意 图 


名 称 | 内容 选择 和 分 发 内 容 外 包 缓存 组 织 


内 容 选 择 缓存 技术 

“全 部 和 部 分 站 点 | 和 E 。 类 内 、 类 间 绥 存 
Po 内 容 分 发 各 非 协作 拉 取 法 缓存 更 新 

AAI 。 更 新 传播 

。 基 于 用 户 会 话 期 。 按 需 更 新 






内 容 选 择 
e 部 分 站 点 内 容 eae 
ARR N/A 
N/A 
内 容 选择 
Limelight e 部 分 站 点 内 容 een 
iets 分 发 Z ISP 方法 非 协 作 拉 取 法 缓存 更 新 
e 按 需 更 新 
i 缓存 技术 
非 协作 拉 取 法 ed 
e 按 需 更 新 
缓存 技术 
协作 拉 取 法 LL TES 
。 按 需 更 新 
缓存 技术 l 
e 、 类 间 缓 存 
e 缓 存 失效 
缓存 技术 
e 类 内 、 类 间 缓 存 
协作 拉 取 法 缓存 更 新 
e 自 适应 性 缓存 更 新 





Mirror Image 


多 ISP 方 法 ; 
拓扑 已 知 的 副本 
放置 





CoDeeN 











。 全 部 和 部 分 站 点 
内 容 分 发 

内 容 聚 类 

。 基于 用 户 会 话 期 






多 ISP 方法 ; 基于 


um 树 的 副本 放置 









单 ISP 方法 ; 最 好 
e 部 分 站 点 内 容 分 发 | 的 副本 置 放 策略 是 通 
过 对 于 不 同 的 策略 的 
定期 评估 来 动态 选择 






Globule 
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商业 CDN 的 内 容 外 包机 制 多 使 用 非 协作 拉 取 法 ， 原 因 在 于 DNS 重 定 向 和 URL 改 
写 使 得 该 方法 简单 易 行 。 协 作 推 送 法 仍然 处 于 理论 阶段 ， 目 前 还 没有 CDN 支持 这 种 
方法 。 相 对 于 非 协作 推送 法 ， 协 作 推 送 法 需要 使 用 更 复杂 的 技术 (如 DHT) ， 一 般 用 
T P2P 架构 的 学 术 CDN 中 "" 。 另 外 ， 当 用 户 数量 很 大 时 ， 此 方法 具有 较 大 的 通信 开 
销 (彼此 交换 报 文 ) 。 并 且 ， 当 内 容 更 新 较为 频繁 或 一 致 性 要 求 比较 苛刻 时 ， 该 方法 
也 并 不 能 提供 高 可 靠 性 的 保证 。 

从 表 2.2 中 也 能 发 现 ， 具 有 代表 性 的 覆盖 大 地 域 的 商业 和 学 术 CDN 使 用 类 间 
(以 及 类 内 和 类 间 的 组 合 ) 缓存 技术 。CDN 主要 将 按 需 更 新 作为 缓存 更 新 策略 。 只 有 
Coral 将 缓存 的 无 效 性 作为 缓存 更 新 策略 ， 因 为 它 只 传递 几乎 不 更 新 的 静态 内 容 。 
Globule 使 用 一 种 自 适应 性 的 缓存 更 新 策略 ， 可 以 在 增强 缓存 一 致 性 的 不 同 技术 之 间 
实现 动态 的 选择 。 在 所 有 缓存 更 新 策略 中 ， 周 期 性 更 新 方法 应 用 最 为 广泛 ， 因 为 在 此 
情况 下 缓存 以 有 规律 的 方式 进行 更 新 ， 因 此 该 方法 具有 成 为 最 有 效 地 确保 缓存 内 容 一 
致 性 的 潜力 策略 。 更 新 的 传播 和 失效 作为 稳 态 控制 机 制 并 不 常用 ， 因 为 它们 挤占 用 了 
本 应 用 于 内 容 服 务 的 网 络 带宽 和 处 理 器 资源 “) 。 内 容 提供 商 可 能 会 自行 管理 和 部 署 
特定 的 缓存 机 制 或 缓存 更 新 的 启发 性 策略 。 特 定 的 分 布 式 缓存 机 制 更 易于 管理 ， 但 是 
效果 有 限 。 另 外 ， 对 于 不 愿 自主 开发 缓存 机 制 的 内 容 提供 商 而 言 ， 启 发 式 缓存 策略 是 
一 个 非常 好 的 策略 。 然 而 ， 启 发 式 方法 取得 的 效果 无 法 与 那些 设计 良好 的 策略 控制 
相 比 “1。 


2.3.3 基于 请 求 路 由 的 分 类 


表 2.3 将 请 求 路 由 分 类 法 映射 到 具有 代表 性 的 CDN 中 。 从 表 中 可 以 看 到 ， 基 于 
DNS 的 机 制 是 实现 请 求 路 由 的 主流 方法 ， 原 因 在 于 实现 简单 ， 而 且 作为 目录 服务 的 
DNS 无 处 不 在 。 基 于 DNS 的 机 制 在 域名 解析 过 程 中 使 用 了 专用 的 DNS 服务 器 。 在 其 
他 请 求 路 由 机 制 中 ， 也 常用 HTTP 重 定向 ， 因 为 用 户 和 副本 服务 器 间 的 显 式 绑 定 成 本 
具有 更 细 的 粒度 。 灵 活性 和 易 用 性 是 HTTP 重 定向 技术 用 于 CDN 请 求 路 由 的 另外 两 
种 原因 。 有 些 CDN (如 Mirror Image) 使 用 GSLB 来 进行 请 求 路 由 ， 该 方法 的 优点 是 
将 CSLB 功能 引入 网 络 时 ， 不 需要 添加 任何 网 络 设 备 。 在 学 术 CDN 中 Coral 探索 了 
覆盖 路 由 技术 ， 其 中 使 用 DSHT 为 请 求 路 由 的 摘要 进行 索引 ， 也 就 是 说 ， 它 在 请 求 重 
定向 中 使 用 了 P2P 技术 。 如 之 前 提 到 的 那样 ， 一 个 CDN 的 请 求 路 由 系统 是 由 一 个 请 
求 路 由 算法 和 请 求 路 由 机 制 组 成 的 。CDN 中 的 请 求 路 由 算法 是 专 有 的 ， 绝 大 多 数 的 
技术 细节 没有 公开 。 本 章 对 现 有 CDN 的 分 析 表 明 ，Akamai 和 Globule 在 请 求 路 由 系统 
中 使 用 了 自 适应 请 求 路 由 算法 。Akamai 的 自 适应 性 请 求 路 由 机 制 (应 对 瞬时 拥塞 ) 
考虑 到 了 服务 器 负载 和 多 种 网 络 指标 ， 而 Globule 仅仅 测量 了 一 个 请 求 需要 经 过 的 AS 
数量 。 对 于 CoDeeN 而 言 ， 请 求 路 由 算法 考虑 到 了 请 求 的 本 地 性 、 系 统 负载 、 可 靠 程 
度 和 邻近 信息 。 另 外 ，Coral 的 请 求 路 由 算法 通过 测量 实时 网 络 性 能 数据 来 提升 本 地 
性 ， 并 存储 拓扑 信息 用 于 增加 客户 端 发 现 邻近 DNS 服务 器 的 可 能 性 。 
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R23 请 求 路 由 分 类 法 映射 示意 图 
CDN 名 称 请 求 路 由 技术 


* 自 适应 请 求 路 由 算法 (使 用 服务 器 负载 和 各 种 网 络 指标 ) 
。 综合 了 基于 DNS 的 请 求 路 由 和 URL 改写 
EdgeStream HTTP 重 定向 
Limelight Networks 基于 DNS 的 请 求 路 由 
全 局 服务 器 负载 均衡 ( GSLB) 


Mirror Image e 全 局 信息 已 知 
o 智能 管理 DNS 


Akamai 


* 请 求 路 由 算法 使 用 请 求 的 本 地 性 、 系 统 负载 、 可 靠 程 度 和 邻近 信息 
* HTTP 重 定向 


局 部 性 得 到 改进 的 请 求 路 由 算法 (通过 测量 网 络 的 最 新 性 能 数据 和 存储 网 络 
Coral 拓扑 信息 ) 
e 基于 DNS 的 请 求 路 由 


* 自 适应 请 求 路 由 算法 (使 用 基于 AS 的 邻近 度 ) 
* 单 层 基于 DNS 的 请 求 路 由 


CoDeeN 


Globule 


2.3.4 ”基于 性 能 测量 的 分 类 


表 2.4 显示 了 不 同性 能 测试 技术 与 代表 性 CDN 的 映射 关系 。 

通过 某 些 参数 估计 技术 测量 CDN 的 性 能 能 够 衡量 CDN 为 其 客户 提供 所 需 内 容 和 
(或 ) 服务 的 能 力 。 衡 量 CDN 性 能 的 指标 应 当 包 括 缓存 命中 率 、 带 宽 消 耗 、 延 时 和 代 
理 缓存 服务 器 的 利用 率 等 。 此 外 ， 其 他 因素 如 存储 、 通 信 系 统 开 销 和 可 扩展 性 也 应 当 
考虑 在 内 。 对 于 性 能 度量 的 估计 能 够 表明 系统 的 当前 状况 ， 并 有 助 于 在 大 系统 中 获得 
高 效 的 请 求 路 由 和 负载 均衡 。 对 于 内 容 提供 商 而 言 ， 应 该 通过 对 一 个 CDN 的 性 能 研 
究 来 选择 最 合适 的 CDN 提供 商 。 然 而 ，CDN 提供 商 的 和 有 封闭 特性 ， 不 允许 内 容 提 
供 商 对 网 络 进行 性 能 测试 。 

从 表 2.4 中 可 以 发 现 ，CDN 的 性 能 测试 可 以 通过 内 部 测量 技术 和 来 自 外 部 的 用 
户 评价 得 到 。 大 多 数 CDN 都 使 用 基于 网 络 探测 、 流 量 监控 等 相关 技术 进行 内 部 性 能 
测试 。Akamai 使 用 预先 的 流量 监控 和 网 络 探 测 进行 性 能 测量 。 在 学 术 CDN 领域 ， 
CoDeeN 具备 本 地 监控 能 力 ， 可 检测 一 个 服务 的 主要 资源 ， 如 可 用 的 文件 描述 符 / 套 接 
字 、CPU 负载 和 DNS 解析 服务 等 ; Coral 能 够 在 响应 一 个 DNS 请 求 之 前 检测 代理 服务 
器 是 否 可 用 (通过 UDP 远程 过 程 调用 ， 即 RPC); Globule 在 用 于 检查 其 他 服务 器 可 
用 程度 的 重 定向 服务 器 上 实现 监控 。 

CDN 提供 商 性 能 的 外 部 测试 并 不 常见 ， 因 为 大 多 数 运 营 中 的 CDN 都 是 非 透明 运 
营 的 商业 企业 ， 这 些 企业 不 公开 其 性 能 测量 的 相关 方法 是 处 于 利益 的 考虑 。 然 而 ， 基 
些 CDN 如 Akamai 也 允许 第 三 方 来 进行 外 部 测试 。 
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表 2.4 性 能 测量 分 类 映射 示意 
CDN 名 字 性 能 测量 


内 部 测量 
© 网 络 探测 
Akamai 。 流量 监控 (周期 性 ) 
外 部 测量 
e 通过 第 三 方 进行 检测 (Giga information group) 
内 部 测量 
e 通过 实时 性 能 监控 服务 (RPMS) 进行 流量 监控 
Limelight Networks N/A 
内 部 测量 


Mirror Image 。 网 络 探测 
e 流量 监控 和 报告 


Edge Stream 





内 部 测量 
。 本 地 流量 和 系统 监控 


内 部 测量 
Coral e 流量 监测 
o 通过 UDP RPC 对 于 服务 器 进行 生存 性 检测 


内 部 测量 
Globule e 流量 监测 
e 通过 重 定向 器 来 检测 服务 器 可 用 性 


CoDeeN 








2.4 讨论 


如 本 章 开 始 所 述 ， 除 了 分 类 法 中 主要 论 及 的 四 个 核心 内 容 ， 一 个 完备 的 CDN 需 
要 考虑 诸多 其 他 因素 ， 如 容错 、 安 全 和 Web 应 用 托管 能 力 等 。 本 章 基于 以 上 话题 进 
行 了 简要 探讨 ， 并 提供 了 相关 的 研究 资料 ， 以 期 读者 能 够 对 相关 研究 领域 的 内 容 有 一 
个 概括 性 的 把 握 。 

CDN 作为 一 个 复杂 的 由 分 布 式 组 件 构成 的 网 络 ， 故 障 和 失效 的 现象 可 能 会 发 生 在 
任何 地 方 ， 使 用 局 部 聚集 等 中 心 化 架构 有 助 于 提高 容错 能 力 。 然 而 ， 当 ISP 到 服务 器 集 
群 的 连接 中 断 时 ， 单 点 失效 就 会 发 生 。 这 个 问题 可 以 通过 部 署 分 布 式 的 Web 集群 ( 镜 
像 ) 或 者 使 用 多 ISP 来 提高 连接 的 可 靠 性 (多 路 寻 址 或 多 路 连接 )。 然 而 ， 尽 管 集群 、 
镜像 或 多 路 寻 址 等 方法 在 某 种 程度 上 提高 了 CDN 的 鲁 棱 性 ,但 也 同时 引入 了 其 他 的 问 
题 。 如 ， 集 群 的 可 扩展 性 不 佳 ， 镜 像 技术 需要 每 一 个 镜像 都 承担 所 有 的 负载 ， 多 路 寻 址 
技术 需要 每 一 个 连接 都 承担 整体 流量 。 因 此 ， 不 同 的 商业 CDN 使 用 其 独特 的 方法 来 提 
高 容错 性 和 可 扩展 性 。 例 如 ，Akamai 开发 了 分 布 式 监控 服务 ， 确 保 服 务 器 或 者 网 络 故 
障 能 在 第 一 时 间 得 到 处 理 ， 从 而 不 对 端 用 户 造 成 影响 。 除 此 之 外 ， 参 考 文献 中 还 提出 了 
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大 量 相关 解决 方案 ， 已 在 一 些 系 统 中 得 到 了 广泛 应 用 。 感 兴趣 的 读者 可 在 参考 文献 
(46, 77, 85] 中 找到 大 规模 系统 中 (如 CDN rp). 的 相关 容错 方法 。 

CDN 中 的 安全 问题 对 系统 开发 来 说 是 另 一 个 挑战 。 在 CDN 的 不 同 层面 上 (如 网 
络 、 路 由 、DNS 或 Web 集群 等 ) 会 有 不 同 的 安全 隐患 ， 一 个 常见 的 威胁 就 是 DDoS 攻 
击 。DDos 攻击 不 仅 会 消耗 稀缺 资源 如 网 络 带宽 或 CPU 等 ， 而 且 也 会 破坏 或 修改 信息 
配置 ， 或 对 网 络 组 件 造成 物理 性 损坏 或 者 算 改 ” 。 安 全 威胁 还 包括 针对 软件 脆弱 性 
的 攻击 ARAE) 和 针对 协议 不 一 致 性 的 攻击 (协议 攻击 )。 目 前 , 已 经 有 很 多 工 
作 涉 及 这 些 大 范围 网 络 存在 的 安全 问题 ,相关 解决 方案 的 资料 可 参见 参考 文 
BA[40, 50, 51, 53, 56, 57, 82], 

WS, Akamai 等 商业 CON 已 经 给 端 用 户 提供 了 基于 使 用 的 内 容 和 应 用 的 分 发 方 
R, Akamai 边缘 计算 架构 (EC), EAE 和 ACDNU? 等 将 数据 保存 在 中 心服 
务 器 中 ， 把 应 用 代码 而 非 应 用 数据 复制 到 边缘 服务 器 ， 这 可 以 将 Web 层 的 那些 应 用 
拓展 到 CDN 平台 上 ， 使 端 用 户 对 应 用 对 象 的 请 求 可 以 直接 在 副本 服务 器 而 不 是 在 源 
服务 器 上 执行 。 然 而 ， 大 量 的 数据 访问 造成 了 持续 增长 的 大 范围 延 时 ， 另 外 ， 中 心服 
务 器 数据 的 高 度 集 中 也 会 导致 瓶颈 。 为 了 解决 这 些 局 限 性 ，Sivasubramanian 4& AU" 
提出 了 一 种 按 需 复制 Web 应 用 的 方法 ， 该 方法 将 数据 进行 部 分 复制 ， 即 只 将 数据 复 
制 到 经 常 访问 该 数据 的 服务 器 上 。 参 考 文献 [39] 中 提出 了 一 种 针对 特定 应 用 的 边缘 
服务 架构 ， 该 应 用 可 以 在 一 个 弱 一 致 性 模型 约束 下 ， 由 其 自己 负责 复制 工作 。 更 多 关 
于 在 大 范围 网 络 中 托管 应 用 的 研究 可 参阅 参考 文献 [88]。 


2.5 总 结 和 结论 


基于 功能 性 和 非 功能 性 的 属性 ， 本 章 对 CDN 进行 了 分 析 和 分 类 ， 提 出 了 一 种 基 
于 四 个 核心 内 容 的 CDN 综合 分 类 机 制 : CDN 构成 、 内 容 分 发 和 管理 、 请 求 路 由 及 性 
能 测试 。 针 对 这 些 概念 ， 本 章 进 一 步 提出 了 相应 的 分 类 法 ， 用 于 区 分 CDN 中 的 若干 
主流 趋势 、 解 决 方案 和 技术 。 另 外 ， 本 章 研究 了 容错 、 安 全 和 Web 应 用 托管 能 力 3 
个 问题 ， 以 此 阐述 在 CDN 开发 中 遇 到 的 若干 挑战 ， 并 提出 了 相关 领域 内 的 研究 方向 。 
本 章 提出 的 分 类 法 为 现 有 CDN 之 间 的 比较 提供 了 基础 ， 所 提 及 的 方法 有 助 于 读者 深 
人 和 了解 领域 内 主流 的 技术 、 服 务 、 策 略 和 具体 实现 。 本 章 也 将 分 类 法 与 代表 性 的 商业 
CDN 和 学 术 CDN 系统 进行 了 对 应 ， 该 对 应 关系 有 助 于 深入 了 解 内 容 分 发 领域 内 的 技 
术 现 状 ， 并 反 过 来 验证 了 分 类 法 的 可 行 性 和 准确 性 。 

最 近 ， 通 过 企业 兼并 ，CDN 业界 正在 经 历 一 场 整合 。 在 本 章 的 前 期 准备 工作 中 ， 
作者 深刻 体会 到 这 种 整合 给 CDN 行业 带 来 的 深刻 影响 。 为 此 ， 为 了 应 对 下 一 代 CDN 
的 新 技术 和 新 架构 的 需要 ， 内 容 分 发 、 缓 存 和 复制 技术 正在 得 到 越 来 越 多 的 关注 ， 这 
将 导致 CDN 的 设计 、 架 构 和 开发 中 产生 新 间 题 。 内 容 网 络 领域 的 现 有 趋势 表明 ， 更 
好 地 理解 和 诠释 该 领域 内 的 相关 基础 概念 是 非常 必要 的 。 因 此 ， 作 者 希望 这 种 基于 分 
类 法 的 全 面 综合 性 比较 框架 ， 不 仅 可 成 为 理解 内 容 分 发 网 这 个 复杂 领域 的 工具 ， 更 有 
助 于 展现 内 容 分 发 网 未 来 研究 的 成 果 。 
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第 3 章 动态 、 可 扩展 和 高 效 的 内 容 复制 技术 


Yan Chen 
3.1 引言 


处 理 器 的 性 能 、 存 储 能 力 和 网 络 带 宽 的 指数 性 增长 正在 改变 我 们 对 计算 的 认识 。 
我 们 的 注意 力 已 经 从 中 心 化 的 、 手 动 配置 的 系统 转 到 全 球 规模 的 分 布 式 、 自 组 织 的 复 
合体 〈 由 成 千 上 万 的 组 件 组 成 ) 。 然 而 ， 现 有 系统 普遍 可 能 存在 着 频繁 的 组 件 故障 ， 
以 及 出 现 因 为 网 络 连接 缓慢 或 连接 失败 而 导致 容易 断 开 的 问题 。 因 此 ， 利 用 本 地 的 资 
源 非 常 重要 一 一 既 为 性 能 ， 也 为 可 用 性 。 进 一 步 讲 ， 普 遍 的 流 式 应 用 必须 精心 设计 它 
们 的 通信 结构 ， 以 避免 占用 过 多 的 资源 。 因 此 ， 要 实现 本 地 访问 和 有 效 的 通信 ， 需 要 
在 数据 副本 和 组 播 节 点 的 放置 方面 实现 更 大 的 灵活 性 。 

为 了 在 取得 灵活 、 可 扩展 的 同时 保留 数据 本 身 的 固有 属性 ， 一 种 方法 是 将 系统 划 
分 为 两 个 副本 层 '” : 一 个 小 型 、 可 靠 的 主 层 (primary tier) 和 一 个 大 型 、 软 状态 
(soft - state) 的 次 层 (second -tier) 。 主 层 可 以 代表 一 个 Web 服务 器 (用 于 Web 内 
容 分 发 ) 、 一 个 存储 系统 的 拜占庭 内 环 “” 或 一 个 流 媒 体 服 务 提供 商 。 主 层 的 重要 之 
处 在 于 它 必须 保持 数据 的 最 新 副本 ， 并 负责 序列 化 和 提交 更 新 。 我 们 将 主 层 视 为 一 个 
黑 盒 ， 简 单 地 称 之 为 “数据 源 ”。 次 层 变 为 软 状 态 将 是 这 一 章 谈论 的 重点 。 次 层 的 例 
子 包括 内 容 分 发 网 (CDN) 、 文 件 系统 缓存 或 Web 代理 服务 器 缓存 (proxy cache) 。 

因为 次 层 副本 是 软 状态 ， 我 们 可 以 动态 地 增长 和 缩小 它们 的 数量 以 满足 系统 约 
束 。 例 如 ， 我 们 可 能 希望 在 QoS 上 有 一 个 基本 保障 ， 以 确保 每 一 个 用 户 与 其 所 访问 的 
数据 副本 之 间 的 最 大 网 络 延 时 有 一 个 上 界 。 因 为 数据 副本 会 消耗 资源 ， 所 以 我 们 试图 
产生 尽 可 能 少 的 副本 来 尽 可 能 地 满足 约束 。 因 此 ,访问 量 高 的 数据 可 以 存在 数 百 乃至 
成 千 上 万 个 副本 ， 而 访问 量 低 的 数据 可 能 并 不 需要 副本 。 

一 个 无 约束 副本 所 面临 的 难题 是 如 何 确 保 所 存储 的 内 容 不 会 过 期 。 某 些 稍为 松弛 
的 同步 要 求 〈( 如 Web’! . OceanStore"" gy Coda" ) ， 人 允许 在 数据 源 出 现 更 新 和 更 新 传 
播 之 间 出 现 一 定 程度 的 延 时 。 然 而 ， 更 新 数据 的 发 送 仍然 必须 及 时 进行 。 大 量 潜在 副 
本 的 存在 使 得 进行 直接 的 、 点 对 点 传送 到 副本 的 更 新 不 可 能 实现 。 事 实 上 ， 次 层 本 身 
具有 的 流动 特性 表明 副本 自 组 织 形成 组 播 树 的 必要 性 ， 我 们 称 这 样 的 组 播 树 为 分 发 树 
(dissemination tree, d - 树 ) 。 由 于 内 部 节点 必须 将 更 新 转发 给 予 节点 ， 所 以 将 通过 对 
树 的 扇 出 进行 约束 来 设法 控制 这 些 内 部 节点 的 负载 。 

次 层 副 本 面临 的 挑战 是 : 为 用 户 提供 良好 的 服务 质量 的 同时 ， 维 持 高 效 和 均衡 的 
设施 资源 消耗 。 为 解决 这 一 挑战 ， 我 们 提出 了 一 个 自 组 织 的 软 状态 复制 系统 ， 称 为 可 
扩展 内 容 接 人 网 (Scalable Content Access Network , SCAN), 3.1 给 出 了 一 个 SCAN 
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系统 的 示意 图 。 图 中 的 网 络 层 给 出 了 两 种 类 型 的 物理 节点 : SCAN 服务 器 (用 正方 形 
表示 ) 和 客户 端 (用 圆圈 表示 ) 。 假 设 SCAN 服务 器 被 放置 在 互联 网 中 主要 服务 提供 
fi (ISP) 的 互联 网 数据 中 心 (IDC) 内 ， 具 备 与 主干 网 的 良好 连接 。 每 个 SCAN 服 
务 器 可 能 包含 各 种 数据 资源 的 副本 。SCAN 系统 的 一 个 新 特性 在 于 它 与 一 个 分 布 式 路 
由 和 定位 (DOLR) 系统 (PH Tapestry ^ ) 相 结 合 。Tapestry 允许 客户 端 在 没有 全 
局 通信 的 情况 下 能 够 定位 邻近 的 副本 。 

图 3. 1 中 展示 了 三 种 类 型 的 数据 : 数据 源 和 副本 位 于 SCAN 服务 器 中 ， 是 本 章 的 
讨论 重点 ; 缓存 位 于 客户 端 ， 它 们 是 数据 的 映像 ， 不 在 本 章 的 讨论 范围 内 ”。 本 章 的 
目标 是 将 客户 端的 数据 请 求 变换 为 对 副本 的 管理 活动 。 本 章 的 主要 贡献 为 : 


CJ 数据 源 


[0 副本 
d ac 


一 一 全 自 适应 一 致 性 


LI 根 服务 器 
[ 服务 器 


C» 客户 端 
m. Tapestry Rd f& 





图 3.1 一 个 SCAN 系统 的 架构 


1) 本 章 提供 了 一 种 算法 ， 能 够 动态 地 放置 最 少数 量 的 副本 ， 同 时 满足 客户 端的 
QoS 要 求 和 服务 器 的 容量 约束 。 

2) 这 些 副本 能 够 以 自 组 织 的 形式 形成 具有 短 延 时 和 低 带宽 消耗 的 d - 树 ， 以 便 
用 于 更 新 的 分 发 。 

一 个 重要 的 直觉 是 ，DOLR 系统 的 存在 使 得 副本 的 同步 放置 和 d - 树 的 构造 不 需 
要 与 数据 源 进 行 通信 。 因 此 ，d - 树 的 每 个 节点 仅 需 为 其 父 节 点 和 子 节点 维持 状态 
即 可 。 

本 章 余 下 内 容 组 织 如 下 : 在 3.2 节 中 介绍 了 该 领域 的 相关 工作 ; 3.3 节 中 研究 了 
副本 放置 问题 ; 3. 4 节 介 绍 本 章 的 算法 ;3. 5 节 讨论 评估 的 方法 ; 评估 结果 在 3. 6 节 
中 给 出 。 


O 有 各 种 不 同 的 方式 保持 缓存 的 一 致 性 ， 如 参考 文献 【44] 。 一 一 原 书 注 
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3.2 前 期 工作 


本 节 首 先 概要 地 介绍 内 容 分 发 系统 ， 包 括 Web 缓存 (3.2.1 节 ) 、 基 于 拉 取 的 非 
协作 式 CDN (3.2.2 节 ) 、 基 于 推送 的 协作 式 CDN (3.2.3 节 )。 通 过 SCAN 对 这 些 系 
统 进行 了 比较 ， 比 较 结果 在 表 3. 1 中 做 了 总 结 。 然 后 ， 针 对 CDN 的 三 个 主要 部 分 讨 
论 了 以 往 的 工作 : 目标 定位 服务 (3.2.4 45) 和 组 播 技 术 更 新 分 发 (3.2.5 节 )。 最 
后 ， 在 3.2.6 节 中 总 结 了 前 期 工作 的 局 限 性 。 


表 3.1 不 同 互联 网 内 容 分 发 系统 的 比较 


Web 缓存 Web 缓存 基于 拉 取 的 基于 推送 的 
(客户 端 创建 ) | (服务 器 创建 ) pim CDN ro CDN 


7, m Æ, MEX 否 ， a eit Dr 


一 f&, & Á 
不 好 ， 中 心 化 | 不 好 ， 中 心 化 
无 重 定 向 Bloom 滤波 器 05] 
来 |cpN CDN 
ome 名 服务 器 名 服务 器 


= e e ls | 


是 , 但 是 不 可 


3.2.1 Web 缓存 


缓存 可 以 由 客户 端 或 服务 器 创建 。 面 向 广 域 和 分 布 式 的 大 多 数 系统 都 由 客户 端 创 
建 ， 如 Web 浏览 器 和 Web 代理 服务 器 '* 1 。 问 题 在 于 ， 这 两 种 解决 方案 (Web 浏览 器 和 
Web 代理 服务 器 ) 都 存在 本 质 缺 陷 : 因为 客户 端 缓存 无 助 于 降低 发 往 邻近 计算 机 的 流 
E, 而 且 Web 代理 服务 器 也 无 法 对 相 邻 的 代理 服务 器 带 来 任何 帮助 。 因 此 ， 缓 存 所 起 
到 的 效用 被 完全 限制 在 同一 站 点 的 客户 端 之 间 远 程 文档 的 低层 共享 中 。 一 种 可 行 的 解决 
方法 是 在 服务 器 端 创建 缓存 ， 它 允许 服务 器 决定 何 时 何 地 分 发 对 象 ”““” 。 从 本 质 上 
说 ，CDN (包括 本 章 提 到 的 方法 ) 是 由 服务 器 来 创建 缓存 ， 同 时 配备 专用 的 边缘 服务 
器 。 以 前 的 由 服务 器 创建 的 缓存 系统 都 是 基于 一 些 不 现实 的 假设 。 

Bestavros 等 人 将 互联 网 建 模 为 一 个 分 层 结构 ， 其 中 任意 内 部 节点 均 可 作为 服务 的 
代理 服务 器 (proxy)“""“。 这 种 假设 是 不 合 实际 的 ， 因 为 内 部 节点 实际 上 是 路 由 器 ， 
不 大 可 能 作为 服务 的 代理 服务 器 来 运行 。 地 理 意义 上 的 推送 缓存 技术 会 基于 对 网 络 拓 
扑 结构 的 全 局 知识 和 用 户 的 访问 模式 来 自行 复制 HTML 网 页 ”。 最 近 ， 自 适应 Web 
lo eg 和 摘要 缓存 05 等 概念 的 提出 ， 使 得 网 站 代理 服务 器 之 间 的 缓存 共享 成 为 可 
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能 。 缓 存 之 间 定 期 地 交换 内 容 的 状态 ， 可 以 消除 延 时 和 额外 的 缓存 探测 操作 所 带 来 的 
资源 消耗 。 然 而 ， 每 一 个 代理 服务 器 需要 将 缓存 内 容 的 更 新 索引 发 送 到 所 有 其 他 的 代 
理 服 务 器 ， 并 需要 存储 其 他 代理 服务 器 的 内 容 索引 。 这 样 ， 即 便 有 着 像 Bloom 滤波 
器 "那样 紧凑 的 内 容 索 引 摘要 ， 缓 存 服务 器 状态 的 维护 和 内 容 交换 次 数 仍然 非常 可 
观 ， 而 且 缓 存 服务 器 的 数量 要 远 远 低 于 文件 数量 。 例 如 ， 有 研究 表明 ， 代 理 服务 器 的 
目标 数量 仅仅 在 100 的 数量 级 上 。 此 外 ， 如 果 没 有 像 CDN 这 样 的 专用 设施 ， 绥 存 
代理 服务 器 就 无 法 应 对 网 络 拥塞 或 连接 失败 ， 也 无 法 提供 分 布 式 负载 均衡 。 


3.2.2 基于 拉 取 的 非 协作 式 CDN 


近来 ，CDN 已 经 实现 商业 化 ， 用 于 提供 Web 托管 、 互 联网 内 容 和 流 媒体 传输 
等 。 基 本 上 说 ， 内 容 根 据 用 户 的 要 求 被 拉 取 到 边缘 服务 器 。 目 前 ， 出 现 了 各 种 机 
制 将 客户 端 请 求 定向 到 一 台 CDN 服务 器 (又 名 CDN 节点 或 边缘 服务 器 ) ， 如 基于 
DNS 的 重 定向 、URL 改写 、HTTP 重 定向 等 ”。 大 部 分 的 商业 CDN 提供 商 (如 Ak- 
amai!'*) | LimeLight Networks! . Mirror Image"?! ) 为 了 实现 透明 性 而 使 用 基于 DNS 
Nee p], 

图 3.2 显示 了 使 用 基于 DNS 重 定向 的 CDN 架构 。 鉴 于 CDN 服务 提供 商 的 快速 增 
长 〈 例 如 ，Akamai 已 经 在 69 个 国家 拥有 超过 25 000 个 服务 器 ， 这 些 服 务 器 分 布 在 大 
约 900 个 网 络 "” ) ， 可 以 假设 对 于 每 一 个 访问 量 较 大 的 用 户 群 ， 都 为 其 配备 一 台 CDN 
服务 器 以 及 一 个 本 地 DNS 服务 器 。 用 户 群 是 那些 在 拓扑 结构 上 邻近 的 一 组 客户 端 。 
这 些 客 户 端 可 以 通过 他 们 的 BGP 前 缀 组 合 在 一 起 ” ， 也 可 以 经 由 其 本 地 DNS 服务 器 
聚 在 一 起 。 后 者 相对 简单 ， 并 且 已 在 实践 中 得 到 了 采纳 ， 但 不 是 很 精确 王 ) 。 
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图 3.2 基于 拉 取 的 非 协作 式 CDN 架构 
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图 3. 2 显示 了 客户 端 检 索 一 个 URL 的 操作 顺序 。 首 先 ， 主 机 名 解析 请 求 经 本 地 ， 
DNS 服务 器 被 送 往 CDN 名 称 服务 器 。 由 于 中 心 化 定位 服务 的 特性 ，CDN 名 称 服务 器 
没有 能 力 保存 所 有 网 址 副本 的 位 置 记录 。 因 此 ， 它 只 能 根据 网 络 邻 近 度 、 带 宽 可 用 性 
和 服务 器 负载 等 信息 进行 请 求 的 重 定 向 。 收 到 重 定向 请 求 的 CDN 服务 器 可 能 没有 副 
本 ， 这 时 它 会 从 Web 内 容 服务 器 上 取 副 本 内 容 ， 然 后 返回 给 客户 端 。 

由 于 非 协 作 方 式 的 特性 ， 目 前 的 CDN 往往 需要 放置 更 多 的 副本 ， 因 为 存储 和 更 
新 的 关系 CDN 往往 会 消耗 更 多 的 资源 。 仿 真 结 果 显示 ， 在 保证 合理 的 延 时 下 ， 基 于 
内 容 推 送 的 协作 式 CDN (在 3. 2.3 节 中 定义 ) 仅仅 使 用 了 少量 的 副本 服务 器 (6% ~ 
8% ) ， 更 新 分 发 带宽 比 非 协作 式 方 法 小 10% 0, 

Rabinovich 和 Aggarwal 提出 了 RaDaR ， 这 是 一 个 全 球 Web 托管 服务 ， 可 以 实现 动 
态 内 容 复 制 和 迁移 “ 。 不 过 ， 它 需要 DNS 给 出 从 客户 端 到 服务 器 的 完整 路 径 ， 这 在 
实际 中 往往 无 法 实现 。 


3.2.3 基于 推送 的 协作 式 CDN 


最 近 的 几 项 研究 工作 号 ,2 4 全 提出 了 一 种 新 思路 ， 即 根据 用 户 的 访问 模式 和 网 
络 的 全 局 拓扑 结构 ， 主 动 地 将 内 容 从 源 Web 服务 器 推送 到 CDN 边缘 服务 器 或 代理 服 
务 器 ， 副 本 之 间 通 过 相互 协作 来 满足 用 户 的 请 求 。 

相对 于 传统 方法 而 言 ， 基 于 推送 的 协作 式 复制 机 制 的 主要 优势 并 不 在 于 使 用 推送 
而 非 拉 取 (只 针对 强制 性 失效 8 ) ， 而 是 来 源 于 副本 之 间 的 协作 共享 。 这 种 协作 大 大 
减少 了 副本 的 数量 ， 从 而 降低 了 复制 和 更 新 的 成 本 "1。 

可 以 采用 一 个 类 似 的 CDN 架构 来 支持 这 种 基于 推送 的 协同 式 内 容 分 发 ， 如 图 3.3 
所 示 。 首 先 ， 基 于 内 容 的 超 链接 结构 和 (或 ) 访问 历史 (由 CDN 名 服务 器 收集 得 
到 ) Web 内 容 服 务 器 以 增 量 的 形式 进行 内 容 的 推送 5,2] 。 内 容 服 务 器 在 后 台 运 行 
“推送 ”进程 ， 将 复制 通知 给 CDN 名 称 服 务 器 ， 该 服务 器 维护 内 容 及 其 副本 之 间 的 映 
射 (其 中 内 容 是 通过 改写 后 的 URL 中 的 主机 名 进行 标识 ) 。 上 述 映射 关系 可 以 是 粗 粒 
度 的 (例如 ， 如 果 以 Web 站 点 为 单位 进行 复制 ， 那 么 映射 就 实现 在 Web 站 点 的 层面 
上 ) ， 也 可 以 是 细 粒 度 的 〈 例 如 ， 如 果 以 URL 为 单位 进行 复制 ， 那 么 映射 就 位 于 URL 
的 层面 上 ) 。 

有 了 这 样 的 副本 定位 跟踪 技术 ，CDN 名 称 服务 器 就 可 以 将 用 户 请 求 重 定向 到 与 
其 最 接近 的 副本 。 值 得 注意 的 是 ， 基于 DNS 的 重 定向 使 地 址 解析 能 在 每 台 主机 上 进 
行 。 我 们 将 DNS 重 定向 与 内 容 修改 相 结合 (如 URL 改写 ) ， 以 实现 对 每 个 对 象 的 重 
定向 中 ， 也 就 是 说 ， 对 不 同 对 象 的 引用 被 改写 为 对 不 同 主机 的 引用 。 为 了 降低 域名 空 
间 的 大 小 ， 可 以 对 对 象 进行 归并 050 ， 归 并 后 的 每 组 对 象 共 享 同样 的 主机 名 ， 为 此 
内 容 提 供 商 可 以 在 推送 内 容 对 象 之 前 改写 URL。 因 此 ， 它 不 会 影响 客户 端 延 时 ， 并 且 
这 种 一 次 性 的 系统 开销 是 可 以 接受 的 。 在 这 两 种 模式 中 ，CDN 的 边缘 服务 器 允许 执行 


名 ”强制 性 失效 (Compulsory miss) 是 指 当 第 一 次 访问 一 一 个 块 时 该 块 不 在 缓存 中 ， 需 要 从 下 一 一 级 存储 
器 中 调 人 缓存 。 译 者 注 
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图 3.3 基于 推送 的 协作 式 CDN 架构 


其 缓存 替换 算法 ， 也 就 是 说 ， 在 基于 推送 的 协作 式 内 容 复制 中 的 映射 关系 是 软 状 态 。 如 果 
客户 端 在 重 定向 后 的 CDN 边缘 服务 器 中 无 法 找到 内 容 ， 要 么 客户 端 可 以 向 CDN 域名 服务 
器 索要 另 一 个 副本 ， 要 么 边缘 服务 器 直接 从 Web 服务 器 拉 取 内 容 并 将 其 发 至 客户 端 。 

在 Li 等 人 的 方法 中 ,处 理 代理 服务 器 放置 问题 的 方式 是 首先 假设 底层 的 网 络 拓 
扑 结 构 是 树 ， 再 将 其 建 模 成 动态 规划 问题 ” 。 虽 然 第 一 步 看 上 去 很 有 新 意 ,但 这 种 
方法 面临 一 个 重大 的 限制 ， 即 互联 网 的 拓扑 结构 并 不 是 树 。 最 近 的 研究 ”对 实际 
的 路 由 和 拓扑 结构 进行 评估 ， 这 些 彼此 独立 的 研究 都 表明 ， 使 用 贪 禁 放置 算法 可 以 使 
CDN 接近 最 优 性 能 。 

为 了 对 已 知 全 局 网 络 拓 扑 结 构 和 客户 端 分 布 这 个 前 提 进 行 简化 ， 一 种 基于 拓扑 通 
知 (topology — informed) 的 互联 网 副本 放置 方法 在 具有 大 扇 出 路 由 器 的 地 方 放置 副 
本 “1 。 研 究 结果 表明 ， 使 用 基于 路 由 器 级 拓扑 的 副本 放置 方法 ， 所 得 到 的 平均 用 户 
延 时 比 使 用 贪 禁 算法 减少 了 10% ~20% ， 但 这 需要 对 放置 方法 进行 精心 设计 。 


3.2.4 对 象 定位 系统 


网 络 化 的 应 用 已 经 将 触角 延伸 到 互联 网 的 各 种 设备 和 服务 。 因 此 ， 当 应 用 扩展 到 
这 些 网 络 资源 时 ， 在 广 域 尺度 上 进行 对 象 的 定位 是 一 个 重要 问题 。 不 仅 如 此 ，WWW 
中 广泛 存在 的 以 读 为 主 的 共享 访问 模式 导致 了 大 量 的 对 象 复制 ， 这 也 带 来 了 对 象 定位 
的 问题 。 目 前 ,很 多 方法 用 于 解决 定位 服务 的 问题 ”””” ， 大 致 可 以 分 为 以 下 三 
组 : 中 心 式 目 录 服 务 (CDS). 、 复 制式 目录 服务 (RDS) 和 分 布 式 目录 服务 (DDS), 


下 面 将 详细 讨论 这 些 相关 研究 工作 ， 不 过 据 笔者 所 知 ， 目 前 尚未 出 现 对 性 能 基准 
和 性 能 比较 的 研究 。 
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1. 中 心 式 目 录 服务 和 复制 式 目录 服务 

一 个 中 心 式 的 目录 服务 驻 留 在 单一 服务 器 上 ， 并 提供 网 络 上 每 一 个 对 象 的 位 置信 
息 ( 见 图 3.4)。 由 于 它 驻 留 在 单 
一 服务 器 上 ， 因 此 非常 容易 遭受 


DoS 攻击 。 一 个 改进 措施 是 使 用 复 

制式 目录 服务 ， 它 能 够 提供 乡 个 FE 

目录 服务 器 。 一 个 复制 式 目录 服 a 

务 具 有 更 高 的 可 用 性 ， 但 保持 数 fo ) 

据 一 致 性 会 引发 额外 的 系统 开销 。 O — 





本 章 并 不 考虑 分 区 的 目录 服务 ， 
因为 它 经 常 需要 额外 的 专用 目录 
服务 器 来 维护 分 区 信息 ， 如 DNS 


Oe RS "— 图 3.4 一 个 中 心 式 目录 服务 (CDS) : 
l : “3PSSTY 客户 端 访问 单一 目录 服务 器 来 得 到 一 个 邻近 


研究 人 员 已 经 开始 研究 分 散 、 部 本 的 位 置信 息 ， 随 后 客户 端 直 接 访问 副本 。 
对 等 和 带 有 分 布 式 哈 希 表 (DHT) — 一 个 复制 式 目录 服务 (RDS) 提供 多 个 目录 


的 定位 服务， 如 CAN), 
Chord” , Pastry st Tapestry ™ 等。 这 些 服务 提供 一 个 分 布 式 的 网 络 设施 ， 能 保证 对 
象 的 迅速 定位 。 不 同 于 依赖 单一 服务 器 定位 对 象 ， 在 这 个 方法 中 一 个 查询 命令 会 在 整 
个 网 络 传播 ， 直 到 一 个 节点 知道 所 请 求 对 象 的 位 置信 息 。 这 种 非 中 心 化 的 定位 服务 能 
够 提供 非常 高 的 可 用 性 。 在 面 对 攻 击 时 ， 即 使 一 组 节点 由 于 受到 攻击 而 瘫痪 ， 所 带 来 
的 影响 也 仅仅 局 限于 很 小 的 对 象 范 围 。 

此 外 ，Tapestry 利用 局 部 性 将 报 文 路 由 到 移动 端点 (如 对 象 的 副本 ) ， 这 种 方式 
不 同 于 其 他 结构 性 对 等 覆盖 网 所 '“”] 。 因 此 ， 使 用 Tapestry 来 建立 SCAN 系统 。 

Tapestry 是 一 个 IP 覆盖 网 ， 它 使 用 一 个 分 布 式 和 容错 架构 来 跟踪 网 络 中 对 象 的 位 
置 。 它 有 两 个 组 成 部 分 : 路 由 网 格 和 分 布 式 定 位 服务 。 

(1) Tapestry 路 由 网 格 

图 3. 5 显示 了 Tapestry 网 的 一 部 分 。 每 个 节点 以 分 布 式 通过 附近 的 代理 服务 器 加 
入 Tapestry 网 ， 建 立 与 其 他 Tapestry 节点 的 邻接 连接 (显示 为 实 线 箭头 )。 这 些 邻 接 
连接 提供 了 从 每 一 个 节点 到 所 有 其 他 节点 的 路 由 ， 路 由 过 程 每 次 解析 一 个 目标 地 址 中 
的 一 位 (例如 ，* * * 8 一 * *98— * 5984598, ， 其 中 * 代表 通配符 ) 。 这 种 路 由 方 
案 是 基于 哈 希 后 级 路 由 结构 ， 最 初 由 Plaxton 等 人 提出 。 i 

(2) Tapestry 分 布 式 定位 服务 

Tapestry 给 每 一 个 对 象 分 配 一 个 全 局 唯一 的 Tapestry 名 称 (GUID). 然后 ， 将 每 
一 个 GUID 映射 到 唯一 的 根 节点 。 存储 服务 器 通过 向 根 节点 发 送 报 文 来 发 布 对 象 ， 并 
在 每 一 跳 保 存 定位 指针 。 图 3. 5 显示 了 一 个 对 象 的 两 个 副本 和 Tapestry 根 节 点 。 这 些 
映射 仅仅 是 指向 存 有 对 象 的 服务 器 * 的 指针 ， 而 非 对 象 的 副本 。 因此 ， 对 于 附近 的 
对 象 ， 用 户 的 搜索 报 文 可 以 很 快 与 发 布 报 文 相 遇 ， 从 而 利用 局 部 性 实现 快速 搜索 。 有 
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图 3.5 ”一 个 分 布 式 目录 (Tapestry); 节点 通过 连接 
( 实 线 箭 头 ) 相连 。 节 点 之 间 的 路 由 每 次 解析 一 位 ， 如 1010 一 2218 > 
9098 — 7598 — 4598。 所 有 的 对 象 与 一 个 特定 的 “ 根 ” 节 点 相关 联 
(如 4598)。 服 务 器 发 布 副本 时 ， 向 根 节点 发 送 报 文 ， 同 时 建立 每 个 
节点 至 副本 的 反 向 指针 (虚线 箭头 ) 。 客 户 端 向 根 节点 发 送 报 文 ， 当 
遇 到 指针 后 就 可 以 直接 路 由 到 副本 (如 0325 一 B4F8 —4432) 。 


研究 结果 表明 '” ， 定 位 对 象 的 平均 距离 与 该 对 象 的 距离 成 正比 。 
3.2.5 分 发 更 新 的 组 播 


对 于 更 新 的 分 发 ， 如 果 将 PP 组 播 作 为 互联 网 内 容 分 布 的 架构 基础 则 存在 根本 性 
问题 。 例 如 ， 它 在 工作 时 只 考虑 空间 因素 ， 而 不 考虑 时 间 ， 而 互联 网 上 的 内 容 分 发 大 
部 分 都 是 同时 基于 两 者 "0 。 此 外 ， 也 没有 广泛 可 用 的 域 间 IP 组 播 。 

作为 替代 方案 ， 出 现 了 许多 应 用 层 组 播 (简称 ALM) ABET MISS Rn 
些 '"” 习 关注 于 小 范围 、 多 源 的 应 用 ， 如 视频 会 议 ， 而 另 一 些 '“" 沁 则 专注 于 大 尺度 、 
单一 来 源 的 应 用 ， 如 流 媒 体 组 播 。Bayeus"" 也 是 建立 在 Tapestry 之 上 ,使 用 Tapestry 位 
置 服务 来 寻找 组 播 根 节点 ， 然 后 使 用 Tapestry 路 由 功能 对 控制 报 文 Cli JACO 和 数 
据 报 文 进行 路 由 。 与 之 不 同 ， 我 们 只 使 用 Tapestry 的 定位 机 制 寻找 附近 的 副本 。 

大 多 数 ALM 系统 都 有 扩展 性 的 问题 ， 因 为 它们 利用 一 个 中 心 节 点 维持 所 有 子 节 
AREA SUO a pb RD WMA” BSGECRCU. 。 复 制 根 节点 是 常见 的 解决 方 
BENS) ， 但 其 缺陷 在 于 存在 同步 问题 和 通信 成 本 的 开销 。 另 外 ，Scriber 和 SCAN 的 
更 新 组 播 系统 ( 即 分 发 树 ) 利用 点 对 点 路 由 技术 和 定位 服务 解决 了 可 扩展 性 问题 。 
Scribe 是 一 个 大 尺度 的 事件 通知 系统 ， 采 用 覆盖 DHT 进行 订阅 和 传播 。 分 发 树 更 有 
效 ， 因 为 使 用 覆盖 DHT 仅仅 实现 订阅 ， 而 使 用 IP 可 直接 进行 分 发 。 


3.2.6 总 结 
综 上 所 述 ， 我们 发 现 以 往 对 CDN 的 研究 和 相关 技术 中 存在 以 下 局 限 性 : 
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1) 由 客户 端 创 建 Web 缓存 是 短视 的 做 法 ， 而 由 服务 器 创建 Web 缓存 具有 不 可 
控 的 内 容 状态 交换 开销 。 这 两 种 方法 都 不 能 适应 网 络 拥塞 和 失效 ， 也 不 能 提供 分 布 式 
负载 均衡 。 

2) CDN 依赖 于 中 心 化 的 定位 服务 ， 因 此 必须 要 么 使 用 低 效 的 基于 拉 取 的 复制 方 
法 〈 非 协作 式 CDN) ,要 么 以 网 站 的 粒度 进行 复制 ， 同 时 牺牲 了 客户 端 性 能 (协作 式 
CDN). 

3) 没有 为 现 有 定位 服务 提供 性 能 基准 或 DoS 攻击 恢复 度 基准 ， 因 此 难 与 其 他 方 
法 进行 比较 。 

4) 副本 /缓存 没有 一 致 性 机 制 ， 互联 网 中 不 存在 人 P 组 播 ， 而 现 有 的 应 用 层 组 播 
则 存在 着 扩展 性 问题 。 

在 SCAN 中 ， 前 两 个 局 限 性 可 以 通过 分 布 式 定位 服务 (BU Tapestry) 得 到 解决 ， 
本 章 也 提出 了 一 个 网 络 DoS 恢复 度 基准 用 来 与 其 他 方法 进行 性 能 对 比 "。 对 于 第 四 
种 局 限 性 ， 本 章 的 解决 方法 是 动态 放置 副本 并 将 其 自 组 织 成 一 个 可 扩展 的 应 用 层 组 播 
树 来 分 发 更 新 ， 这 将 在 下 面 进行 讨论 。 


3.3 动态 副本 放置 问题 


如 图 3. 1 所 示 ， 副 本 放置 是 SCAN 中 的 一 个 关键 组 成 部 分 。 根 据 用 户 的 要 求 ， 它 
动态 地 放置 最 小 数量 的 副本 来 同时 满足 QoS 和 服务 器 容量 的 限制 。 上 节 中 所 讨论 的 定 
位 服务 通过 Tapestry 的 PUBLISHOBJECT API 函数 获取 新 副本 的 信息 '”。 

将 网 页 副本 放置 问题 转化 为 一 个 优化 问题 并 对 其 建 模 ， 则 需要 考虑 很 多 因素 ， 
下 面 对 该 问题 进行 描述 。 考 虑 一 个 流行 度 很 高 的 Web 站 点 或 CDN 的 托管 服务 器 ， 
其 目的 是 通过 将 内 容 推 送 到 若干 托管 服务 器 节点 来 提升 自身 性 能 。 问 题 是 需要 动 
态 决 定 内 容 在 哪里 被 复制 ， 从 而 使 得 一 些 相 应 的 目标 函数 能 够 在 动态 流量 模式 和 
用 户 的 QoS 约束 和 (或 ) 资源 的 约束 下 得 到 最 优 解 。 这 个 目标 函数 要 么 能 够 最 大 
限度 地 降低 延 时 、 丢 包 率 、 吞 吐 量 等 QoS 指标， 要么 可 以 最 小 化 CDN 服务 提供 商 
的 复制 成 本 (如 网 络 带 宽 消 耗 ) 或 一 个 整体 成 本 函数 (如 果 每 个 连接 都 被 赋予 一 
个 成 本 ) 。 对 于 Web 内 容 的 分 发 ， 复 制 成 本 中 的 主要 资源 消耗 是 每 个 接 人 主干 网 的 
互联 网 数据 中 心 (IDC) 的 网 络 访问 带宽 。 因 此 ， 对 于 一 个 给 定 的 Web 对 象 ， 成 本 
和 副本 数量 呈 线 性 正比 关系 。 

在 Qiu 等 人 的 研究 中 ,试图 在 副本 数量 的 约束 下 最 小 化 所 有 用 户 请 求 的 总 响应 延 
时 [1 。 我 们 从 另 一 个 角度 来 分 析 这 个 副本 放置 问题 ， 即 最 小 化 副本 数量 的 同时 ， 满 
足 用 户 对 于 延 时 的 约束 和 服务 器 能 力 的 约束 。 在 这 里 ， 假 设 用 户 能 够 根据 与 CDN 提 
供 商 协商 达成 的 服务 水 平 协定 (SLA) 提供 一 个 合理 的 延 时 约束 。 这 样 ， 定 义 Web 
内 容 放 置 问题 如 下 : 

假设 网 络 C 由 客户 端 集合 C 和 服务 器 节点 集合 5 构成 ， 每 个 用 户 c, 都 有 其 延 时 约 
3X d;， 并 且 每 个 服务 器 s joi alib d ipia 1。 现在 的 问题 是 找到 一 
个 最 小 的 服务 器 集合 8"， 使 得 任意 用 户 c 和 其 “ " 服务器。 e 8' 之 间 的 距离 有 界 
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(由 4d; 控 制 )。 更 正式 的 表述 为 : 找到 最 小 的 开 ， 使 得 存在 集合 SCS， 其 中 1 S'I =K 
且 对 于 VceC3s e SUE distance(c, s.) <d.。 与 此 同时 ， 这些 客户 端 C 和 服务 器 S B 
组 织 成 一 个 应 用 层 的 组 播 树 ， 其 中 C 作为 叶 节 点 ， 且 对 于 VsieS' ， 其 扇 出 度 (ME 
接 子 节点 数 ) 满足 f(s;) Slo 


3.4 副本 放置 算法 


使 用 基于 DOLR 并 结合 路 由 局 部 性 算法 ， 可 以 同步 实现 副本 放置 和 树 的 构建 。 每 
一 个 SCAN 服务 器 都 是 DOLR 的 成 员 ， 这 样 新 的 副本 就 被 发 布 到 DOLR 中 。 此 外 ， 每 
个 客户 端 将 其 请 求 定向 到 其 代理 SCAN 服务 器 ， 此 代理 服务 器 与 其 他 SCAN 服务 器 进 
行 交互 ， 并 将 内 容 分 发 到 客户 端 。 

尽管 在 构建 树 的 过 程 中 使 用 DOLR 来 定位 副本 ,但 通信 和 是 通过 IP 进行 的 。 特 别 
地 , 在 d- 树 的 节点 间 使 用 了 下， 以 使 父 节 点 和 子 节点 之 间 保 持 跟踪 。 此 外 ， 如 果 客 户 
端 发 出 的 请 求 导致 一 个 新 副本 的 放置 ， 那 么 客户 端的 代理 服务 器 会 保存 一 个 指向 该 副 
本 的 缓存 指针 ， 这 就 可 以 在 代理 服务 器 到 副本 之 间 直 接 对 请 求 进行 路 由 。 缓 存 指针 是 
软 状态 的 ， 因 为 一 直 可 以 使 用 DOLR 来 定位 副本 。 


3.4.1 副本 放置 的 目标 


副本 放置 的 目的 在 于 同时 满足 客户 端 延 时 和 服务 器 负载 的 约束 。 客 户 端 延 时 是 指 
一 个 客户 端 从 SCAN 系统 读 取信 息 所 需要 的 往返 时 间 ， 我 们 设法 将 其 保持 在 预先 定义 
的 约束 范围 内 。 服 务 器 负载 是 指 给 定 服务 器 需要 处 理 的 通信 量 ， 假 设 该 负载 与 服务 器 
服务 的 用 户 数 和 d - 树 的 子 节点 数 直接 相关 ， 并 设法 使 其 低 于 一 个 特定 的 上 限 值 。 我 
们 的 目标 是 在 满足 这 些 约束 的 同时 ， 最 小 化 所 部 署 的 副本 数量 ， 同 时 保持 d - 树 的 平 
衡 以 及 在 更 新 时 产生 尽 可 能 少 的 流量 。 在 3. 6 节 中 将 给 出 实验 结果 。 


3.4.2 动态 放置 


我 们 的 动态 放置 算法 分 为 副本 搜索 和 副本 定位 两 个 阶段 。 副 本 搜索 试图 找到 已 有 
的 副本 ， 并 在 不 过 载 的 情况 下 满足 延 时 约束 。 如 果 这 一 步 成 功 ， 则 在 客户 端 放置 一 个 
链接 ， 并 将 其 缓存 在 客户 端的 代理 服务 器 上 。 如 果 没 有 成 功 ， 则 进入 副本 放置 阶段 添 
加 一 个 新 的 副本 。 

在 副本 搜索 阶段 ， 使 用 DOLR 寻找 与 客户 端 代理 服务 器 较 近 的 副本 ， 称 为 “入 
口 ”副本 。DOLR 的 局 部 性 能 够 确保 该 人 口 副本 可 以 作为 一 个 合理 的 备 选 副本 与 客户 
端 进行 通信 。 此 外 ， 由 于 d - 树 已 经 联通 ， 因 此 此 入 口 副本 可 以 与 所 有 其 他 副本 交 
互 。 这 样 ， 我 们 可 以 设想 存在 三 种 搜索 方式 : 单一 的 〈Singular， 只 考虑 人 口 副本 )、 
局 部 的 (Localized， 考 虑 到 父 节点 、 子 节点 和 同 级 节点 的 入口 副本 ) 及 穷 举 的 Ex- 
haustive， 考 虑 所 有 副本 ) 。 对 于 一 个 给 定 的 方式 ， 我们 检查 所 有 的 相关 副本 并 在 其 中 
选择 一 个 满足 约束 的 副本 ; 如 果 没 有 任何 副本 满足 约束 ， 则 建立 一 个 新 的 副本 。 
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procedure DynamicReplicaPlacement_Naive(c,o) 
1 “通过 DOLR [8] o 发 出 JOIN 请 求 ， 到 达 和 口服 务 器 s。 采 集 路 径 中 每 个 服务 
at S'HI IP... disti, (c, s') Frey. 
2 if rc, >Othen 
if dist... (c, s) «d, thens 成 为 c 的 父 节 点 exit, 
else 
s 对 c 运行 ping 命令 ， 得 到 dist, (c, s). 
4 if dist, (c, s) <d, then s 成 为 ec 的 父 节 点 exit, 
end 
end 
5 在 s 处， 选择 路 径 中 满足 rc, >0 H. dit, (t, c) <d. 最 小 的 s'。 
if 不 存在 这 样 的 *” then 
6 对 路 径 中 的 每 一 个 服务 器 ，s* 计算 dist, (ec，s') ， 选 择 满 足 条 件 
rc, >0 H dist, (t, c) <d. 的 使 distip 最 小 的 s'。 
end 
7 :在 s' 处 放置 一 个 副本 ， 并 作为 其 父 节 点 ，s' 作 为 c 的 父 节点 。 
8 s'fEDOLR 中 发 布 副 本 ，exit。 








算法 1: 简单 动态 副本 放置 。 符 号 定义 : 对 象 。， 延 时 约束 为 d. 的 用 户 c<， 入 口服 务 器 
s， 每 一 个 服务 器 的 剩余 容量 为 rc。( 服务器 能 处 理 的 额外 子 节点 ) ， 覆 盖 距 离 dist。 
(x, y)) AIP SERS (dist, (x, y)) 分 别 表示 在 覆盖 网 和 下 网 上 的 往返 时 间 (RIT). 

从 用 户 代理 的 服务 器 发 送 报 文 到 人 口 副 本 时 ， 将 副本 的 放置 限制 在 被 DOLR 路 由 
协议 访问 的 服务 器 。 我 们 能 够 在 没有 全 局 IP 拓扑 先 验 知识 的 情况 下 也 能 定位 这 些 服 
务 器 。DOLR 的 局 部 特性 表明 这 些 地 点 都 适合 副本 的 放置 。 本 章 考虑 两 种 放置 策略 : 
Eager 方法 将 副本 放置 在 距离 用 户 尽 可 能 近 的 地 方 ;Lazy 方法 将 副本 放置 在 距离 用 户 
尽 可 能 远 的 地 方 。 如 果 所 有 满足 延 时 约束 的 服务 器 都 过 载 ， 就 替换 一 个 旧 的 副本 。 如 
果 人 口服 务 器 过 载 ， 则 断 开 其 d — 树 中 建立 时 间 最 久 的 连接 。 











procedure DynamicReplicaPlacement_Smart(c,o) 
1 “通过 DOLR 发 送 JOIN 请 求 到 。， 到 达 入 口服 务 器 *。 

2 RA s 传递 到 子 节点 (sc) 、 父 节点 (p) 和 同 级 节点 (ss). 

3 每 一 个 rc, >0 的 家 庭 成 员 t 发 送 re, Bl c, c 通过 TCP 的 三 次 握手 来 测 
f&dist, (t, c), 

4 if 存在 ! 且 dxi (t, c) < d, then 

5 c 选择 re, 值 最 大 且 dist, (t, c) < 的 上 作为 父 节 点 ，exit。 


else 
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6 c 通过 DOLR 发 送 PLACEMENT 请 求 到 。， 到 达 入 口服 务 器 s。 
采集 路 径 中 每 个 服务 器 的 IP... dist... (c, 8’) 和 rc,。 
7 在 * 处， 选择 路 径 中 满足 rc, >0 A dist, (t, c) <d. 最 小 的 s'。 
if ”不 存在 这 样 的 s' then 
8 对 路 径 中 的 每 一 个 服务 器 s，s 计算 dist, (c, s'), ， 选 择 满足 re, >0 
H dist, (t, c) <d. 条 件 的 使 disie 最 大 的 。 
end 
9 ss 在 s' 处 放置 一 个 副本 ， 并 作为 其 父 节 点 ，* 作为 ec 的 父 节点 。 
10  s'fg DOLR 中 发 布 副本 exit, 


end 











算法 2: 智能 动态 副本 放置 。 符 号 定义 : 对 象 。， 延 时 约束 为 d. 的 用 户 c<， 入 口服 
务 器 *， 每 一 个 服务 器 * “的 剩余 容量 为 rc,,，( 服务 器 能 处 理 的 额外 子 节点 )， 禾 盖 距 离 
(dis, (x, y)) 和 了 下 距离 (diste (x, y)) 分 别 表示 在 覆盖 网 和 1IP 网 上 的 往返 时 
la] (RTT), 

1. 动态 技术 

现在 可 以 将 上 述 搜索 和 放置 方法 进行 组 合 ， 生 成 动态 副本 管理 算法 。 下 面 重点 介 
绍 两 种 组 合 : 

(1) 简单 放置 (Naive Placement) 

这 是 单一 搜索 法 和 Eager 放置 法 的 一 个 简单 组 合 ， 这 种 启发 式 方法 可 以 使 搜索 和 
放置 的 流量 最 小 。 

(2) 智能 放置 (Smart Placement) 

这 是 一 个 较为 复杂 的 算法 ， 如 算法 2 所 示 。 该 算法 利用 局 部 搜索 法 和 Lazy 放 
置 法 。 

注意 ， 我 们 试图 使 用 覆盖 延 时 来 估计 IP 延 时 ， 以 便 减 少 ping 报 文 的 数量 。 在 这 
里 ， 用 户 可 以 在 打开 浏览 器 时 启动 一 个 由 CDN 服务 提供 商 提供 的 后 台 程序 ， 以 便 能 
主动 地 参与 到 这 些 协议 中 。Tapestry 网 的 局 部 特性 自然 导致 了 d- 树 的 局 部 性 ， 即 子 
节点 和 父 节点 之 间 倾 向 于 彼此 接近 (用 IP 跳 数 来 衡量 ) ， 这 就 可 以 在 分 发 更 新 时 降低 
延 时 和 组 播 带宽 的 消耗 (测量 结果 见 3.6 节 ) 。 与 简单 放置 方法 相 比 ， 智 能 放置 方法 
消耗 了 较 多 的 “加 入 ”流量 来 构造 了 一 个 具有 较 少 副本 、 覆 盖 更 多 客户 端 、 具 有 更 
少 的 延 时 和 组 播 带 宽 消耗 的 树 。 我 们 将 在 3. 6 节 评估 这 两 种 方法 的 权衡 效果 。 

2. 静态 比较 

我 们 知道 ， 上 面 给 出 的 副本 放置 方法 在 副本 的 部 署 数 量 上 不 太 可 能 达到 最 优 ， 这 
是 因为 客户 端 是 逐个 地 加 入 ， 并 且 对 网 络 拓扑 结构 所 知 有 限 。 在 静态 方法 中 ， 根 服务 
帮 具 备 对 网 络 拓扑 的 完整 信息 ， 并 在 得 到 所 有 来 自 客户 端的 请 求 后 才 放 置 副 本 ， 更 新 
则 是 通过 人 P 组 播 进 行 分 发 。 静 态 放置 方法 不 太 符合 实际 情况 ,但 是 因为 它 可 以 利用 
用 户 分 布 情况 和 网 络 全 局 拓扑 结构 ， 因 此 反而 能 提供 更 好 的 性 能 。 
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3.3 节 中 定义 的 问题 可 以 转换 为 限量 设施 定位 问题 的 一 种 特殊 形式 2 ， 其 定义 
A: 给 定 一 组 构建 设施 的 位 置 i;， 在 位 置 i 的 设施 构建 成 本 为 f， 每 一 个 客户 端 j 必须 
被 分 配 到 一 个 设施 ， 由 此 引入 的 成 本 为 dc;， 其 中 qd 表示 节点 j 的 设施 需求 ，c, 表 示 
Ki Bj 的 距离 。 每 一 个 设施 最 多 能 够 服务 LAE. Ae A RR DR S ls s p 
本 最 小 的 设施 数量 和 位 置 。 

为 了 将 设施 定位 问题 转换 为 我 们 要 求 的 形式 , 设置 代价 f 恒 为 1， 当 位 置 i 能够 覆盖 
客户 端 ) 时 设 cj 为 0， 否则 设 cj 为 w 。 目 前 已 知 最 好 的 近似 算法 使 用 原始 对 偶 算 法 和 拉 格 
朗 日 松弛 算 子 ， 确 保 解 的 上 界 不 高 于 最 优 解 的 4 倍 ” 。 然 而 ， 这 种 算法 对 于 实际 应 用 而 言 
显得 过 于 复杂 。 所 以 ,我们 设计 了 一 个 贪 焚 算 法 ， 该 算法 具有 对 数 级 的 近似 比率 。 

除了 上 面 的 符号 ， 我 们 定义 以 下 变量 : C, 表 示 被 ; 覆盖 的 客户 端 集合 ， 其 中 Ce 
C HX F YceC, Ñ distp (c, s) <d.; 3. 表 示 客 户 端 c 可 能 的 服务 器 父 节点 集合 ， 
中 Se3S 且 对 于 VseS 有 di (c, s) <d,. 













procedure ReplicaPlacement_Greedy_DistLoadBalancing(C,S) 


输入 : 被 覆盖 的 客户 端 集 合 : C， 所 有 服务 器 的 集合 : S 
输出 : 被 选择 用 于 副本 放置 的 服务 器 集合 : S 





while C 非 空 do 

RAJ ses, HF s 具有 min (1,1 , rc,) 的 最 大 值 

选择 min (| C.1 , rc,) 中 的 最 大 者 se5S 

S'=S'U js} 

S=S- Ís} 

if | Cl <re,then C-C-C, 

else 
以 1 S, 1 为 关键 字 对 C, 中 的 每 个 元 素 s 进行 升序 排序 
选择 C, 中 最 前 面 的 re, 个 客户 端 作 为 Case 
C = C — C Charen 





end 

对 VceC， 重 新 计算 s, 
end 
return S’ 








算法 3: 带 负载 均衡 的 静态 副本 放置 。 

现在 考虑 两 种 类 型 的 静态 副本 放置 方法 : 

1) 静态。 根 节点 具有 全 局 IP 拓扑 的 知识 。 

2) 覆盖 静态 。 对 于 每 一 个 客户 端 <， 根 节点 只 知道 从 < 到 根 节点 ， 且 覆盖 该 客户 


端的 Tapestry 路 径 上 的 服务 器 (以 IP 距离 计算 )。 
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前 者 是 一 种 “确保 不 超过 ”的 最 佳 放 置 ， 我 们 期 望 它 产生 的 副本 总 数 最 少 且 组 播 
流量 最 低 ; 后 者 使 用 了 我 们 能 想到 的 最 好 方法 来 从 DOLR 系统 收集 所 有 的 拓扑 信息 。 


3.4.3 软 状态 树 管理 


软 状 态 的 设施 有 可 能 具有 极 大 的 和 鲁 棒 性 ， 这 是 因为 它们 可 以 很 容易 地 通过 重新 配 
置 来 适应 各 种 环境 。SCAN 系统 的 目标 是 实现 两 种 改进 : 故障 恢复 和 性 能 调 优 。 

为 了 实现 故障 恢复 ， 数 据 源 通过 d - 树 周 期 性 地 发 送 “心跳 ” 报 文 。 成 员 服 务 器 
知道 心跳 报 文 的 频率 ， 所 以 当 它们 在 足够 长 的 时 间 内 还 没有 收 到 心跳 报 文 时 就 会 采取 
相应 的 措施 。 与 上 面 提 到 的 副本 搜索 阶段 类 似 ， 这 时 副本 会 启动 一 个 “重新 加 入 ” 
的 进程 来 寻找 新 的 父 节点 。 此 外 ， 每 个 成 员 服务 器 定期 向 其 父 节 点 发 送 “刷新 ” 报 
文 。 如 果 父 节点 在 一 定 的 预 设 时 间 内 没有 收 到 刷新 消息 ， 则 认为 与 子 节点 的 连接 中 
断 。 有 了 这 种 软 状态 分 组 管理 ， 任 何 SCAN 服务 器 的 崩溃 都 不 会 对 CDN 的 总 体 性 能 
产生 显著 的 影响 。 

性 能 调 优 包括 删除 节点 和 重新 平衡 化 4 - 树 。 如 果 客 户 端的 流量 较 低 ， 则 叶 节 点 
上 的 副本 将 被 去 除 。 为 了 平衡 d - 树 ， 每 个 成 员 服 务 器 定期 地 重新 加 入 以 寻找 新 的 最 
佳 父 节 点 。 


3.5 评估 方法 


因为 ns2 7 的 规模 只 能 达到 1000 个 节点 ， 所 以 本 节 为 SCAN 实现 了 一 个 基于 事件 
驱动 的 模拟 器 ， 包 括 一 个 数据 包 级 的 网 络 模拟 器 (使 用 Tapestry DOLR 的 一 个 静态 版 
本 ) 和 一 个 副本 管理 框架 。 软 状态 副本 层 通 过 模拟 的 客户 端 工作 负载 进行 驱动 。 本 
节 的 评估 方法 包括 评价 指标 、 网 络 设置 和 工作 负载 。 


3.5.1 评价 指标 


我 们 的 目标 是 对 3.4. 2 节 中 提 到 的 副本 策略 进行 评估 ， 这 些 策略 分 别 是 动态 简单 
放置 (od_naive) 、 动 态 智 能 放置 (od smart)、 和 覆盖 静态 放置 (overly s) IP $$ 
态 放置 (IP_s)。 我 们 通过 三 类 指标 对 这 四 种 策略 的 效果 进行 比较 : 

(1) 副本 放置 的 质量 

包括 副本 的 部 署 数量 和 负载 分 布 度 ， 后 者 等 于 每 一 个 副本 服务 器 下 面 的 客户 端 数 
量 均值 与 标准 差 的 比 。 

(2) 组 播 性 能 

我 们 测量 相对 延 时 惩罚 (RDP) 和 带宽 消耗 ， 其 中 带宽 消耗 通过 对 网 络 中 所 有 
连接 的 传输 时 间 与 字 节 数 的 乘积 求 和 得 到 。 例 如 ， 假 设 两 个 连接 的 延 时 分 别 为 10ms 
和 20ms， 则 它们 传输 1KB 的 带宽 消耗 为 1KB x (10 +20)ms =0.03(KB * s), 

(3) 树 的 构建 流量 

该 指标 包括 应 用 层 发 送 的 报 文 数 与 用 于 部 署 副本 和 构建 d - 树 所 消耗 的 带宽 。 

此 外 ， 我 们 还 通过 计算 在 受 约束 或 不 受 约束 时 的 最 大 负载 来 对 容量 约束 的 效果 进 
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行 量化 ， 其 中 最 大 负载 定义 为 所 有 SCAN 服务 器 上 的 客户 端 缓存 子 节点 的 最 大 数量 。 
另外 ， 还 针对 各 种 客户 端 / 服 务 器 的 比率 和 服务 器 的 密度 进行 了 敏感 性 分 析 。 


3.5.2 WARE 


为 了 评估 复制 策略 ， 使 用 GT -ITM transit - stub 模型 生成 5 个 包含 5000 个 节点 
的 拓扑 结构 ”， 并 对 这 5 个 拓扑 结构 上 的 实验 结果 进行 平均 。 一 个 数据 包 级 、 基 于 
优先 级 队列 的 事件 管理 器 被 用 于 仿真 网 络 延 时 。 该 模拟 器 对 物理 链 路 的 分 发 延 时 进行 
建 模 , 但 忽略 了 带宽 限制 、 排 队 延 时 和 包 丢 失 的 因素 。 

我 们 利用 两 个 策略 来 放置 SCAN 服务 器 ， 其 中 一 个 策略 是 随机 选择 所 有 的 SCAN 
服务 器 〈 记 为 随机 SCAN) ， 另 一 个 则 是 优先 选择 传输 节点 (transit node) 和 网 关节 
点 〈 记 为 主干 SCAN) 。 

为 了 与 基于 DNS 重 定向 的 CDN 进行 比较 ， 我 们 模拟 了 该 系统 所 具有 的 典型 行为 。 
在 实验 中 ， 假 定 每 一 个 客户 端 请 求 都 被 重 定向 到 最 近 的 CDN 服务 器 上 ， 这 些 服 务 器 将 
为 客户 端 缓存 被 请 求 信息 的 副本 。 这 意味 着 ， 流 行 度 高 的 对 象 有 可 能 被 缓存 在 每 个 CDN 
服务 器 上 。 另 外 ， 假 设 内 容 服务 器 可 以 通过 IP 组 播 将 更 新 数据 发 送 到 副本 服务 器 上 。 


$53 工作 负载 


为 了 评估 复制 方案 ， 我 们 不 仅 使 用 了 一 个 人 工 生成 的 工作 负载 ， 和 Web 服务 器 
收集 的 真实 访问 日 志 ， 这 些 工 作 负 载 是 探索 SCAN 更 广泛 应 用 的 第 一 步 。 

人 工 生成 的 工作 负载 是 对 瞬时 拥塞 简化 后 的 近似 。 瞬 时 拥塞 是 一 种 不 可 预测 的 、 
由 事件 驱动 的 流量 激增 ， 会 拖 垮 服务 器 并 终止 网 站 的 服务 。 在 仿真 中 ， 所 有 的 客户 端 
(而 非 服 务 器 ) 随机 向 某 一 给 定 热门 对 象 发 出 请 求 。 

实验 中 基于 跟踪 驱动 (trace - driven) 的 仿真 包括 一 个 大 型 的 热门 商业 新 闻 网 
站 ， 即 MSNBC'* ， 以 及 来 自 美国 宇航 局 肯尼迪 航天 中 心 ” 的 跟踪 记录 。 

表 3.2 显示 了 详细 的 跟踪 信息 。 我 们 通过 以 下 方式 使 用 访问 日 志 : 使 用 从 BBN- 
Planet (Genuity) 路 由 器 中 获取 的 BCP K”, 3k-T BCP 前 级 对 Web 客户 端 进行 分 
组 ?1。 对 于 美国 宇航 局 的 跟踪 记录 ， 因 为 在 跟踪 中 大 多 数 人 口 包含 主机 名 ， 所 以 我 
们 基于 域名 对 客户 端 进行 分 组 ， 其 中 域名 定义 为 主机 名 的 最 后 两 项 。 例 如， 
al. bl. com 和 a2. bl. com 属于 同一 个 域 。 假 设 可 以 模拟 的 最 大 拓扑 结构 为 5000 个 节点 
( 受 限 于 内 存 容量 ) ， 我 们 模拟 了 MSNBC 的 4000 个 顶级 客户 端 组 (覆盖 了 请 求 总 数 
的 86. 1% ) 和 美国 宇航 局 的 所 有 客户 端 组 。 由 于 这 些 客户 端 不 可 能 在 传输 节点 或 服 
务 器 节点 ， 所 以 将 之 随机 映射 到 拓扑 结构 中 的 其 余 节 点 。 


表 3.2 Web 站 点 访问 记录 统计 


ELE 


10-11 am, 8/2/99 


4X, 7/1/95 64398 
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3.6 评估 结果 


在 本 节 中 ,我 们 评估 了 SCAN 动态 副本 管理 算法 的 性 能 ， 结 果 显 示 : 
1) 对 于 真实 的 工作 负载 ， 相 对 于 IP 组 播 的 静态 副本 放置 ，SCAN 的 副本 放置 数 
量 接近 最 优 值 ， 同 时 能 够 提供 良好 的 负载 均衡 、 低 延 时 以 及 合理 的 更 新 带宽 消耗 。 
l 2) 无 论 复制 还 是 更 新 带宽 消耗 ，SCAN 都 优 于 现 有 的 基于 DNS 重 定向 的 CDN。 
3) SCAN 的 性 能 对 SCAN 服务 器 放置 、 客 户 端 / 服 务 器 比率 以 及 服务 器 密度 等 因 
素 相 对 不 敏感 。 
4) 容量 约束 对 于 负载 均衡 非常 有 效 。 
我 们 将 先 给 出 对 人 工 负载 的 仿真 结果 ， 然 后 再 提供 实际 Web 跟踪 结果 。 


3.6.1 人 工 工作 负载 的 结果 


我 们 首先 对 人 工 模拟 的 瞬时 拥塞 负载 进行 分 析 。SCAN 服务 器 通过 “随机 ”或 
“主干 ”的 方式 选择 500 个 节点 ， 其 余 的 节点 作为 客户 端 以 随机 的 顺序 访问 一 些 热门 
对 象 。 我 们 随机 选择 一 个 非 传输 节点 的 SCAN 服务 器 作为 数据 源 ， 并 把 热门 对 象 的 大 
小 设 为 50KB。 此 外 ,假设 延 时 约束 为 50ms， 负 载 能 力 设 为 每 个 服务 器 处 理 200 个 客 
户 端 。 

1. 策略 之 间 的 比较 

图 3.6 显示 了 放置 副本 的 部 署 数量 和 这 些 服务 器 上 的 负载 分 布 。od_smart 使 用 的 
服务 器 数量 仅 占 od_ naive 使 用 量 的 30% ~ 60% ， 甚 至 好 于 overlay_s， 非常 接 近 最 优 
的 了 P_s。 男 外 需要 注意 的 是 ,无 论 随机 SCAN 还 是 骨干 SCAN od_smart 的 负载 分 布 
比 od. naive 和 overlay s 都 要 好 ， 接 近 了 IP s, 








0 
g : ; 
0 od. naive od. smart overlay. s IP s od naive od smartoverlay sIP s 


图 3.6 部署 的 副本 数量 (AR) 和 被 选 服务 器 的 负载 分 布 ( 右 图 ) (500 个 SCAN 服务 器 ) 


相对 延 时 惩罚 是 d - 树 中 任 一 成 员 与 根 节点 之 间 的 覆盖 延 时 和 单 播 延 时 的 比 
xm 图 3.7 SAX, od smart 的 RDP 指标 比 od. naive 要 好 ， 其 中 85% 的 RDP 值 都 在 
4 以 内 。 在 图 3.8 中 ， 对 各 种 副本 放置 技术 与 最 佳 的 IP 静态 放置 方法 的 带宽 消耗 进行 
了 对 比 ， 结 果 是 非常 令 人 鼓舞 的 :od_ smart 的 带宽 消耗 非常 接近 IP_s, JF ALG od. 
naive 小 得 多 。 
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资源 到 成 员 对 的 累积 百分比 


: overlay_naive， 随 机 SCAN ` 
， overlay_smart， 随 机 SCAN ——— - 
-Overlay_naive， 主干 SCAN - -x - - -~ 


， overlay smart, F SCAN 








z 
i 
L2 
i 
g 
Ri 

od_naive, od smart, IP s, od naive, od smart, IP s, 

随机 随机 随机 ET EF 主干 


3.8 1MB 更 新 组 播 的 带宽 消耗 (500 个 SCAN 服务 器 ) 


上 述 性 能 的 取得 都 是 建立 在 一 定 的 d - 树 构建 成 本 之 上 ( 见 图 3.9)。 然 而 , 无 论 随 
机 还 是 主干 SCAN，od_ smart 产生 的 报 文 数 比 od_naive 少 3 倍 ， 是 最 优 情形 正 _s 的 1/6。 


分 2500 





构建 d- 树 的 带宽 成 本 (kB 





od naive od smart overlay s — IP. s od naive od smart overlay s IP s 


图 3.9 构建 d- 树 所 需要 的 应 用 层 报 文 数 ( 左 图 ) 和 
总 带宽 消耗 (HE) (500 个 SCAN 服务 器 ) 
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同时 ，od_naive [iE FH T 5; IP. s 几乎 相同 的 带宽 ， 而 od. smart 使 用 的 带宽 是 IP_s 的 3 ~5 
倍 。 

总 之 ， 智 能 动态 算法 的 性 能 接近 理想 情况 〈 使 用 卫 组 播 的 静态 放置 ) 。 与 简单 动 
态 算 法 相 比 ， 它 可 以 实现 接近 最 优 的 副本 数量 、 更 好 的 负载 分 配 以 及 更 少 延 时 和 组 播 
带宽 占用 。 当 然 ， 代 价 是 3 ~5 倍 于 简单 动态 算法 的 d - 树 构 建 流量 。 然 而 ， 由 于 d - 
树 构建 的 频率 要 远 远 低 于 数据 访问 和 更 新 ， 因 此 从 总 体 性 能 上 看 这 是 一 个 很 好 的 
折 中 。 

由 于 服务 器 的 分 布 和 (或 ) 数量 有 限 ， 在 面临 QoS 和 容量 需求 时 有 可 能 一 些 客 
户 端 不 能 被 覆盖 到 。 在 这 种 情况 下 ， 我 们 的 算法 可 以 有 助 于 决定 在 哪里 放置 更 多 的 服 
务 器 。 实 验 结 果 表 明 ， 由 于 很 难 做 到 负载 均衡 ， 简 单 动态 方法 未 覆盖 到 的 客户 端 数量 
要 远 远 多 于 智能 方法 ， 因 此 在 下 面 对 人 工 负 载 的 研究 中 将 不 再 考虑 简单 方法 。 

2. 与 CDN 的 比较 

同时 ， 我 们 也 将 覆盖 智能 方法 与 基于 DNS 重 定向 的 CDN 进行 了 比较 。 结 果 表 
明 ， 相 对 于 传统 的 CDN 而 言 ， 在 分 发 更 新 时 覆盖 智能 方法 使 用 的 副本 数 仅 占 传 统 
CDN 的 6% ~8% ， 带宽 消耗 小 于 10% 。 

3. 分 布 式 负载 均衡 的 有 效 性 

下 面 将 验证 容量 约束 如 何 对 三 个 客户 端 组 (100, 1000 和 4500) 实现 负载 均衡 ， 
其 中 前 两 个 是 从 4500 个 客户 端 中 随机 抽取 生成 。 图 3. 10 显示 ,缺乏 容量 约束 GLH 
w/o LB) 会 导致 热点 或 拥塞 情况 的 出 现 : 一 些 服务 器 需要 承担 的 负载 量 达 到 了 其 最 
高 能 力 的 大 约 2 ~13 倍 。 为 了 方便 比较 ， 将 使 用 负载 均衡 后 的 性 能 记 为 w/ LB, 
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一 1500 X —&- overtay siw/LB = 2000 =A- overtay_s,w/LB 
& 1000 - Ce ALS fe me —<— overtay s,w/o LB 
K — IP s,w/LB j 
mx 500 一 zi 500 J — = |P_s,w/LB 
j —e- IP_s,w/o LB 0 —e-|P swoLB 
100 1000 4500 100 1000 — 4500 
客户 端 客户 端 客户 端 客户 端 客户 端 客户 端 


图 3. 10 ”对 于 不 同 数量 的 客户 端 ， 使 用 和 未 使 用 负载 均衡 约束 (LB) 所 测量 到 的 最 大 负载 
( 左 图 : 500 个 随机 服务 器 ， 右 图 : 500 个 主干 服务 器 ) 


4. 性 能 对 客户 端 /服务 器 比率 的 敏感 性 

我 们 进一步 使 用 三 组 客户 端 对 SCAN 进行 评估 。 图 3. 11 显示 了 副本 部 署 的 数量 。 
当 客 户 端 数量 较 少 时 ，w/LB 和 w/o LB 区 别 不 大 ， 因 为 这 时 没有 服务 器 超过 限制 。 
od_smart 需 要 的 副本 数 一 直 低 于 overlay_s， 并 保持 在 IP. s 的 1.5 倍 以 内 。 与 前 面 类 似 ， 
我 们 也 仿真 了 其 他 的 性 能 指标 ， 包 括 不 同 客户 端 /服务 器 比率 下 更 新 组 播 的 负载 分 布 、 
ia 得 到 的 结果 大 体 相 似 ， 即 od_ smart 总 是 好 于 overlay_s， 且 非常 接 
Yr T IP. s, 
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图 3. 11 对 于 不 同 数量 的 客户 端 ， 使 用 和 未 使 用 负载 均衡 约束 (LB) 所 测量 到 的 
副本 部 署 数 量 ( 左 图 : 500 个 随机 服务 器 ， 右 图 : 500 个 主干 服务 器 ) 


5. 性 能 对 服务 器 密度 的 敏感 性 

接 下 来 ， 我 们 提高 了 SCAN 服务 器 的 密度 ， 从 5000 个 节点 中 随机 选择 2500 个 作 
为 SCAN 服务 器 。 结 果 表 明 ， 这 种 设置 可 以 为 客户 端 提供 更 好 的 QoS$， 同 时 也 需要 更 
少 的 服务 器 容量 。 这 样 ， 我 们 将 延 时 约束 设置 为 30ms， 容 量 约束 为 50 个 客户 端 / 服 
务 器 ， 客 户 端的 数量 在 100 ~ 2500 之 间 变 化 。 

在 SCAN 服务 器 密度 很 高 的 情况 下 ，od_ smart 使 用 的 副本 数 仍 比 overlay_s 少 ， 
尽管 两 者 的 值 相当 接近 。 了 P_s 仅 需 要 一 半 左 右 的 副本 ， 如 图 3. 12 所 示 。 此 外 ， 我 们 
注意 到 ， 负 和 载 均衡 仍然 发 挥 着 作用 ， 也 就 是 说 ， 不 对 算法 进行 精心 设计 而 仅仅 简单 地 
投入 更 多 的 服务 器 ， 无 助 于 避免 服务 器 过 载 或 拥塞 问题 。 

总 之 ， 在 不 同 的 SCAN 服务 器 部 署 、 客 户 端 /服务 器 比率 和 服务 器 密度 的 配置 下 ， 
od. smart 均 表 现 良好 ， 说 明基 于 容量 约束 的 分 布 式 负 载 均 衡 是 有 效 的 。 
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图 3.12 使 用 2500 个 随机 SCAN 服务 器 ， 使 用 和 未 使 用 负载 均衡 约束 (LB) 
所 测量 到 的 副本 部 署 数量 ( 左 图 ) 和 最 大 负载 ( 右 图 ) 


3.6.2 Web 跟踪 的 工作 负载 情况 


下 面 研究 SCAN 在 对 热门 度 差异 很 大 的 不 同文 档 进行 Web 跟踪 时 的 性 能 。 图 
3. 13a 给 出 了 我 们 使 用 的 两 个 跟踪 的 请 求 分 布 (需要 注意 的 是 * 轴 是 对 数 坐标 )。 结 果 
表明 ， 对 不 同 URL 的 请 求 数 在 这 两 个 跟踪 上 的 分 布 非常 不 均匀 。 
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对 跟踪 中 的 每 个 URL， 我 们 计算 了 od naive, od smart 和 IP_s 所 产生 的 副本 数 
量 。 随 后 ， 对 od_naive 和 od_smart 产生 的 副本 数量 进行 归 一 化 ， 也 就 是 将 这 两 个 数 
量 与 IP_s 产生 的 副本 数量 相 除 。 图 3. 13b 中 给 出 了 NASA 和 MSNBC 的 这 一 比率 的 累 
计 分 布 函数 (CDF)。 从 图 中 可 以 发 现 ， 各 条 CDF 曲线 中 百分比 较 低 的 部 分 相互 重 
得， 并 接近 1。 产 生 这 个 现象 的 原因 在 于 大 多 数 URL 很 少 有 人 访问 ， 而 且 我 们 仅仅 仿 
真 了 一 个 有 限 的 时 间 ， 因 此 三 种 方法 所 得 到 的 被 部 署 的 副本 数量 较 少 ， 而 且 彼 此 相差 
不 大 。 然 而 ， 对 于 热门 对 象 而 言 ，od_ smart 和 od. naive 的 差异 很 大 ， 对 应 于 图 中 百 
分 比较 高 的 部 分 。 对 于 所 有 对 象 ，od_ smart 非常 接近 于 IP_s, NASA 的 比率 不 到 2.7， 
MSNBC 大 约 是 4. 1， 而 使 用 od naive 时 上 述 两 个 比率 分 别 达 到 5.0 和 15. 0。 
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3.13 ”在 100 个 主干 SCAN 服务 器 上 对 NASA 和 MSNBC 的 跟踪 仿真 
a) 选择 不 同 数量 的 顶级 URL 时 所 覆盖 的 请 求 百分比 b) 使 用 od_naive 和 od_smart 产生 的 副本 数量 的 CDF 
(这 两 个 数量 使 用 IP_s 产生 的 副本 数量 进行 了 归 一 化 ) 


此 外 ， 我 们 对 分 发 更 新 时 的 带宽 消耗 进行 了 对 比 。 给 定 一 个 单位 大 小 的 更 新 ， 我 
们 使 用 以 下 三 种 方式 分 别 计算 了 所 有 URL 的 带宽 消耗 : (Dod. naive 树 的 覆盖 组 播 ; 
@od_smart 树 的 覆盖 组 播 ; @IP_s 树 的 IPAM. 与 上 面 一 样 , 使 用 @ 的 结果 对 中 和 
@ 的 结果 进行 归 一 化 ， 得 到 的 CDF 曲线 与 图 3. 13b 非常 相似 。 

从 上 面 的 分 析 可 以 发 现 ， 对 访问 不 太 频 繁 的 对 和 象 或 冷门 对 象 来 说 ，od_ smart 和 
od_naive 的 性 能 表现 比较 相似 ， 不 过 对 于 热门 对 象 ( 占据 了 主要 的 访问 量 )，od_ smart 
的 性 能 要 明显 好 于 od_naive。 


3.6.3 讨论 


Tapestry 中 拓扑 结构 的 改变 是 如 何 影响 副本 放置 的 ? 需要 注意 的 是 ，Tapestry 中 
的 覆盖 距离 一 般 来 说 要 比 IP 距离 大 2 ~3 倍 。3.6 节 的 仿真 结果 显示 了 由 此 带 来 的 不 
利 结果 : 在 副本 放置 中 overlay_s 与 IP_s 使 用 了 完全 相同 的 算法 ， 但 overlay s 使 用 静 
态 Tapestry 级 的 拓扑 而 不 是 IP 级 拓扑 。 仿 真 结果 表明 ，overlay_s 放置 的 副本 数量 是 
PP_s 的 1.5~2 倍 以 上 。 出 于 类 似 的 原因 ，od_smart 的 性 能 超过 了 overlay s, REA 
AJ od. smart 使 用 了 ping 报 文 来 得 到 客户 端 和 服务 器 之 间 的 实际 人 P 距离 。 这 个 观测 结 
果 也 解释 了 为 什么 od. smart 能 得 到 与 IP. s 相似 的 性 能 表现 。 因 此 ， 可 以 采用 一 个 期 
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望 的 缩放 因子 来 “缩放 ”覆盖 的 延 时 ， 由 此 来 估计 真实 的 IP 距离 ， 这 样 就 能 够 降低 
ping 探测 所 引发 的 流量 。 


3.7 结论 


随 着 分 发 系统 的 日 益 普 遍 和 全 球 化 ， 自 适应 的 副本 放置 和 更 新 分 发 方法 变 得 越 来 
越 重 要 。 本 章 提 出 的 SCAN 是 一 种 可 衡量 、 软 状态 的 副本 管理 框架 ， 它 建立 在 一 个 利 
用 局 部 性 的 分 布 式 对 象 定 位 和 路 由 框架 (DOLR) ZE, SCAN 在 需要 时 生成 副本 ， 
并 将 副本 自 组 织 到 一 个 应 用 级 组 播 树 中 ， 同 时 又 兼顾 到 对 客户 端 服务 质量 (QoS) 和 
服务 器 容量 的 约束 。 本 章 对 SCAN 进行 了 基于 事件 驱动 的 仿真 ， 结 果 表 明 SCAN 放置 
的 副本 数量 接近 最 优 ， 与 此 同时 ，SCAN 也 提供 了 良好 的 负载 分 配 和 低 延 时 性 能 ， 与 
基于 IP 组 播 的 静态 副本 放置 相 比 ， 带 宽 消耗 也 相对 较 低 。 不 仅 如 此 ， 在 复制 和 更 新 
成 本 方面 ，SCAN 的 性 能 要 优 于 现 有 的 基于 DNS 重 定向 的 CDN。 对 于 构建 全 球 性 对 等 
网 络 设施 而 言 ，SCAN 将 很 有 希望 成 为 其 一 个 关键 性 的 组 成 部 分 。 
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443 ”内容 分 发 和 管理 


Claudia Canali, Valeria Cardellini, Michele Colajanni 和 Riccardo Lancellotti 
4.1 引言 


在 过 去 的 十 年 中 ， 互 联网 从 一 种 以 盈利 为 目的 的 内 容 分 发 手段 演变 为 一 种 重要 的 
通信 媒介 ， 用 户 通过 互联 网 可 以 得 到 人 迫切 需要 的 信息 和 服务 。 互 联网 的 上 述 成 功 转 
变 ， 得 益 于 内 容 提 供 商 OCP) 对 内 容 分 发 性 能 的 关注 。 面 对 高 可 用 性 、 可 扩展 性 和 
网 络 性 能 的 要 求 ， 内 容 提供 商 常 用 的 办 法 是 利用 第 三 方 的 服务 来 提高 内 容 和 服务 分 发 
的 性 能 。 从 技术 上 讲 ， 内 容 分 发 网 络 (CDN) 提供 商 的 目标 就 是 : 即使 在 面临 测 涌 
而 至 的 请 求 时 也 能 确保 内 容 分 发 具有 足够 的 性 能 。 

CDN 最 初 的 目标 是 在 互联 网 上 分 发 静态 的 网 络 内 容 和 一 些 有 限 大 小 的 视频 /音频 
流 。 第 一 代 CDN 最 初 的 设计 目标 ， 是 用 于 缓解 当 静 态 网 页 内 容 经 过 一 些 拥堵 的 对 等 
点 (peering points) 时 引起 的 阻塞 。 不过， 内 容 分 发 所 面临 的 环境 已 经 与 十 年 前 有 了 
很 大 的 不 同 ， 在 互联 网 中 需要 分 发 的 内 容 已 经 变 得 更 加 复杂 了 。 目 前 网 络 上 的 内 容 ， 
根据 用 户 的 偏好 和 需要 常 具有 个 性 化 特点 ， 并 需要 实现 动态 的 生成 。 传 统 的 用 于 静态 
内 容 的 分 发 技术 已 经 不 能 满足 新 的 需要 ; 同时 ， 动 态 内 容 的 分 发 存在 着 一 些 玻 待 解决 
的 固有 挑战 和 限制 。 近 年 来 ，CDN 开始 支持 动态 内 容 的 分 发 ， 这 就 使 内 容 提供 商 可 
以 将 CDN 的 优势 应 用 于 当前 的 网 络 应 用 和 服务 。 

本 章 讨 论 的 问题 ， 是 如 何 使 用 CDN 进行 内 容 (特别 是 动态 产生 的 内 容 和 个 性 化 
AA) 的 分 发 。 除 了 当前 Web 系统 的 主要 功能 ， 本 章 还 介绍 如 何 通过 将 一 个 典型 的 
ZE Web 系统 的 功能 复制 到 CDN 的 节点 上 ， 来 提高 内 容 分 发 的 性 能 和 扩展 性 。 对 于 
每 一 种 解决 方案 ， 除 了 学 术 界 的 最 新 研究 成 果 ， 本 章 同 时 也 介绍 了 使 用 这 些 方案 的 工 
业 级 产品 。 不 仅 如 此 ， 本 章 还 将 介绍 每 一 种 基于 CDN 的 复制 方案 的 优 缺 点 ， 并 指出 
哪些 情况 下 可 以 得 到 最 好 的 收益 而 哪些 条 件 下 会 降低 性 能 。 

本 章 的 内 容 是 这 样 安排 的 : 4. 2 节 中 介绍 相关 的 背景 资料 ， 给 出 一 个 分 发 动态 和 
个 性 化 内 容 的 Web 系统 的 逻辑 各 层 ， 并 对 这 些 层 所 使 用 的 主要 缓存 和 复制 方法 进行 
了 分 类 ; 4.3 ~4.5 节 详 细 地 解释 这 些 逻 辑 层 如 何 映射 到 CDN 的 节点 上 以 加 速 静态 和 
动态 内 容 的 分 发 ; 4. 6 节 讨 论 的 是 在 一 个 分 布 式 分 发 网 络 设 施 上 ， 与 用 户 配 置信 息 的 
管理 和 复制 相关 的 一 些 问 题 ; 在 最 后 的 4.7 节 中 对 本 章 进 行 了 总 结 ， 给 出 了 若干 结论 
以 及 研究 方向 。 


O ”所谓 对 等 点 ， 是 指 互联 网 中 充当 接 人 点 或 各 子 网 之 间 路 由 交换 中 心 的 节点 。 一 一 译 者 注 
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4.2 Web 内 容 分 发 系统 


本 节 对 那些 产生 和 分 发 Web 内 容 的 系统 的 体系 结构 进行 简要 的 介绍 ， 并 提供 一 
些 背景 资料 。 首 先 ， 在 4. 2.1 节 中 对 多 层 Web 系统 的 各 人 逻辑 层 进行 回顾 ; 其 次 ,在 
4.2.2 节 中 介绍 了 CDN 的 架构 和 主要 的 功能 。 为 了 加 速 动态 内 容 和 个 性 化 内 容 的 创建 
和 分 发 ，CDN 在 一 个 Web 系统 的 各 逻辑 层 使 用 了 不 同 的 缓存 和 复制 方法 。 在 最 后 的 
4.2.3 节 中 将 对 这 些 方法 进行 分 类 。 


4.2.1 Web 系统 的 逻辑 层 


当前 绝 大 多 数 Web 系统 是 基于 一 个 多 层 
的 逻辑 架构 ， 这 个 架构 包括 HTTP 接口 、 应 用 
(业务 ) 人 逻辑、 数据 仓库 以 及 可 能 的 与 用 户 有 
关 的 身份 验证 和 内 容 个 性 化 信息 ， 这 些 层 常 | 
被 称 为 前 端 (fron — end) 层 、 应 用 (applica- 
tion) 层 、 后 端 (back-end) 层 和 用 户 配 置 
(user profile) B®, K 4. 1 显示 了 一 个 提供 
Web 服务 的 典型 系统 的 结构 ， 从 中 可 以 看 到 
组 成 这 个 系统 的 各 个 逻辑 部 分 以 及 各 层 之 间 
最 基本 的 交互 。 

前 端 层 是 Web 服务 的 接口 。 该 层 接受 来 i 
自 客户 端的 HTTP 连接 请 求 ， 进 而 将 来 自 文件 Em EE HH ere 
系统 的 静态 内 容 提供 给 用 户 ， 因 此 它 代表 了 = == 
一 个 指向 中 间 层 应 用 逻辑 的 接口 。 静 态 内 容 o0 V RATUENIE 
的 分 发 是 一 个 直接 的 操作 。 静 态 Web 内 容 一 般 存 储 在 一 个 文件 系统 中 ，HTTP 服务 器 
管理 客户 端 对 这 类 内 容 的 请 求 ， 从 文件 系统 中 取出 相应 的 资料 发 送 回 客户 端 。 

前 端 层 处 理 的 静态 内 容 有 以 下 例子 : 

(1) 艇 在 一 个 网 页 中 的 网 络 对 象 

典型 的 能 人 对 象 包括 图 片 、 样 式 表 及 活动 组 件 ， 如 flash 动画 、Java 程序 、Ac- 
tiveX 控件 。 

(2) 多 媒体 内 容 

音频 流 和 视频 流 是 前 端 层 处 理 的 静态 内 容 。 为 了 能 够 在 客户 端 实 现 多 媒体 内 容 的 
平滑 播放 ， 通 常 采 用 基于 HTTP 流 的 方法 ， 即 将 多 媒体 资源 分 为 若干 个 数据 块 ， 然 后 
逐个 顺序 地 发 送 到 客户 端 。 只 要 收 到 第 一 个 数据 块 ， 客 户 端 就 能 够 开始 播放 ， 而 不 需 
要 一 直 等 到 全 部 资源 都 接收 完毕 。 

(3) 页 片 (Page fragment) 

页 片 是 一 个 具有 独特 主题 或 功能 的 网 页 的 组 成 部 分 "“”。 页 的 每 一 个 片段 都 被 视 
为 一 个 独立 的 信息 实体 。 例 如 ， 一 个 门户 网 站 的 页 面 一 般 包含 新 闻 、 特 写 、 链 接 条 和 
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广告 等 片段 。 因 为 有 些 片 段 可 能 被 多 个 页 共用 ， 所 以 在 静态 内 容 的 管理 中 使 用 片段 是 
为 了 提高 Web 内 容 的 复 用 能 力 。 不 过 ， 在 使 用 基于 页 片 的 静态 内 容 管理 时 ， 前 端 层 
还 要 负责 在 向 用 户 发 送 网 页 数据 之 前 将 页 片 组 装 为 网 页 。 

应 用 层 位 于 Web 服务 的 核心 : 它 处 理 所 有 的 业务 逻辑 ， 并 计算 那些 用 于 生成 动 
态 内 容 的 相关 信息 。 在 产生 所 需 内 容 时 ， 应 用 层 常常 需要 与 后 端 层 和 用 户 配 置 层 发 生 
交互 ， 这 就 要 求 能 够 实现 应 用 逻辑 与 后 端 层 中 存储 的 数据 之 间 的 交互 ， 而 且 也 必须 能 
够 在 需要 产生 个 性 化 内 容 时 访问 用 户 的 配置 信息 。 动 态 内 容 是 在 响应 客户 端 请 求 时 创 
建 的 ， 应 用 层 所 创建 的 动态 内 容 的 例子 如 下 : 

1) 从 一 个 有 组 织 的 信息 源 检索 出 的 答案 ， 如 购物 车 中 的 商品 信息 或 在 一 个 电子 
商务 网 站 的 搜索 结果 。 

2) 动态 创建 的 与 数据 表示 相 分 离 的 网 络 内 容 ， 如 内 容 管理 系统 ”或 基于 XML 的 
技术 “提供 了 实现 Web 文档 中 结构 与 内 容 相 分 离 的 机 制 。 在 这 些 系统 中 ， 内 容 (BD 
使 它 的 生命 周期 相对 长 一 些 ) 从 一 个 模板 实时 、 动 态 地 创建 。 由 于 需要 进行 数据 库 
检索 、( 可 选 的 ) 信息 处 理 以 及 生成 HTTP 输出 信息 等 操作 ， 动 态 数据 的 创建 会 面临 
一 定 的 计算 压力 ， 所 以 相 比 而 言 通过 软件 (尤其 是 专门 为 处 理 数据 而 设计 的 软件 ， 
如 数据 库 管 理 系统 ) 方便 地 处 理 数据 就 显得 尤为 重要 。 

3) 由 用 户 的 社会 行为 产生 的 Web 内 容 ， 如 论坛 和 博客 的 网 页 为 互联 网 用 户 提供 
了 交换 信息 的 场所 。 

后 端 层 为 一 个 Web 服务 管理 其 主要 的 信息 库 。 一 个 典型 的 后 端 层 由 关键 信息 库 
和 一 个 数据 库 服务 器 组 成 ， 其 中 关键 信息 库 用 于 产生 动态 内 容 。 如 果 再 看 一 下 应 用 层 
创建 动态 内 容 的 例子 ， 就 能 唯一 地 确定 下 面 的 数据 库 : 

1) 在 一 个 电子 商务 站 点 ， 使 用 一 个 数据 库 来 存储 产品 的 目录 ， 并 按 产品 分 类 对 
数据 库 进 行 搜索 。 进 而 ， 通 过 保存 有 购物 车 状态 或 购买 产品 清单 的 数据 库 ， 就 可 以 管 
理 用 户 与 网 页 的 交互 信息 。 

2) 如 果 是 一 个 内 容 管理 系统 ,那么 在 产生 网 络 资源 的 过 程 中 ， 创 建 动态 内 容 的 
模块 对 数据 库 进 行 访问 ， 从 中 检索 出 网 页 的 模板 和 相应 的 实际 内 容 。 

3) 对 于 论坛 或 博客 等 网 站 ， 主 题 、 评 论 内 容 和 邮件 一 般 都 存储 于 一 个 数据 库 中 。 

用 户 配 置 层 保存 用 户 的 偏好 和 运行 环境 ”。 这 些 信息 在 创建 动态 内 容 时 被 访问 ， 
可 以 提供 个 性 化 的 信息 。 存 储 在 用 户 配 置 资料 中 的 信息 可 能 源 于 以 下 几 个 方面 : 

1) 由 用 户 提供 的 信息 。 一 般 借助 一 张 信 息 输入 表 来 增加 和 修改 用 户 的 偏好 信 
息 。 这 种 资料 的 交流 可 能 发 生 在 用 户 注册 时 ， 也 可 能 发 生 在 注册 后 用 户 对 信息 的 增添 
或 修改 时 。 

2) 通过 分 析 推 断 出 的 信息 。 这 种 信息 是 采用 数据 挖掘 等 典型 方法 从 网 络 日 志 中 
对 用 户 的 行为 进行 分 析 后 推断 出 的 史 82) 。 一 个 典型 的 依靠 数据 挖掘 收集 信息 的 网 
络 服 务 的 例子 ， 是 电子 商务 中 使 用 的 产品 购买 推荐 系统 "" ,以 及 根据 用 户 的 偏好 生 
成 量 身 定制 的 广告 。 





o 若 想 详细 了 解 目前 常用 的 内 容 管理 系统 ， 可 以 参见 http://www. emsmatrix. org。 一 一 原 书 注 
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4.2.2 一 个 简化 的 CDN 架构 


CDN 架构 的 设计 目标 ， 是 通过 复制 系统 资源 (BU Web 服务 器 ) 的 方式 来 获得 高 
性 能 和 高 扩展 性 ， 以 确保 在 海量 内 容 下 仍 能 提供 高 性 能 的 服务 。 系 统 资源 的 复制 可 以 
在 本 地 和 地 理 两 个 尺度 上 进行 。 如 果 是 本 地 复制 ， 则 响应 用 户 请 求 的 各 台 服 务 器 紧密 
地 连接 在 同一 个 局 域 网 内 。 这 些 服 务 器 一 般 是 共享 同一 条 上 行 连接 ， 这 条 上 行 连接 将 
本 地 系统 连接 到 互联 网 。 这 样 的 本 地 系统 一 般 称 为 集群 或 能 (cluster) 。 经 过 系统 资 
源 的 复制 ， 若 干 台 服务 器 组 织 成 一 个 集群 后 可 以 提供 更 大 的 计算 能 力 ， 它 们 之 间 能 够 
以 快速 有 效 的 方式 彼此 交互 "。 不 仅 如 此 ， 复 制 还 可 以 提高 容错 能 力 ， 因 为 一 个 出 
错 的 节点 能 够 很 容易 地 被 旁 路 。 

基于 局 域 网 的 本 地 系统 有 很 多 优点 。 不 过 ， 当 网 站 访问 量 很 大 时 ， 本 地 系统 的 可 
扩展 性 在 有 效 地 创建 和 分 发 资源 方面 面临 着 一 些 问题 。 影 响 本 地 复制 的 第 一 个 问题 是 
所 谓 的 “第 一 公里 ” (first mile) 问题 。 第 一 公里 是 指 服务 器 集群 和 互联 网 之 间 的 网 
络 连 接 ， 它 是 影响 端 到 端 性 能 的 系统 瓶颈 。 不 仅 如 此 ， 它 还 是 一 个 潜在 的 失效 单 点 。 
无 论 集群 的 计算 能 力 如 何 ， 集 群 内 通信 不 畅 、 外 部 某 个 路 由 器 的 失效 和 拒绝 服务 
(DoS) 攻击 都 可 能 会 造成 集群 无 法 提供 服务 。 当 需要 更 好 的 性 能 和 可 扩展 性 时 ， 在 
地 理 这 个 尺度 上 复制 网 络 设施 中 的 一 些 资源 会 有 所 帮助 。 

图 4.2 显示 的 是 一 个 CDN 在 地 理 上 的 分 布 架 构 简 图 。 在 一 个 典型 的 CDN 中 ， 服 
务 器 分 为 两 类 : 边缘 服务 器 (edge server) 和 核心 服务 器 (core server) 7, WHRAR 
务 器 是 源 服务 器 (核心 服务 器 ) 在 “互联 网 边缘 ”的 副本 ， 主 要 负责 与 使 用 网 络 服 
务 的 客户 端 实现 交互 。 边 缘 服务 器 是 指 那些 与 客户 端 距 离 最 近 的 服务 器 ， 一 个 典型 的 
例子 是 多 ISP 的 网 络 接 入 点 (Points Of Presence, POP). 通过 基于 DNS 的 重 定向 方 
法 ， 客 户 端 的 请 求 从 源 服务 器 转发 到 边缘 服务 器 "*”* 。 在 这 个 方法 中 ，DNS 服务 器 
需 事先 做 某 些 调整 ， 以 便当 其 收 到 对 主机 名 的 查询 时 ， 可 以 将 其 解析 为 合适 的 边缘 服 
务 器 的 全 地 址 。 寻 找 最 佳 边缘 服务 器 的 算法 一 般 较为 复杂 ， 需 要 考虑 地 理 意义 上 的 
距离 、 网 络 意义 上 的 距离 、 网 络 连接 情况 和 边缘 服务 器 的 状态 等 因素 。 

源 服务 器 


客户 端 


图 4.2 一 种 简化 的 CDN 架构 
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核心 服务 器 是 一 个 逻辑 实体 ， 负 责 处 理 网 络 设施 的 管理 、 服 务 请 求 分 配 的 协调 以 
及 维护 请 求 列表 。 核 心服 务 器 可 以 是 一 台 单 独 的 高 性 能 服务 器 ， 也 可 以 是 一 个 多 集群 
(multi - cluster) ， 即 若干 个 服务 器 集群 的 集合 。 多 集群 中 的 各 个 集群 之 间 相 互 协作 ， 
对 外 表现 为 一 台 虚 拟 的 高 可 用 性 和 高 计算 能 力 的 计算 机 。 


4.2.3 内容 的 创建 和 分 发 的 加 速 


互联 网 演化 的 趋势 是 对 内 容 分 发 的 可 扩展 性 和 高 性 能 提出 了 越 来 越 大 的 需求 ， 这 
使 内 容 提供 商 开 始 转 而 依靠 CDN。 同 时 ，CDN 也 需要 为 内 容 提供 商 研究 加 速 内 容 分 
发 的 技术 。 

为 了 理解 CDN 如 何 加 速 互 联网 内 容 和 应 用 的 分 发 ， 可 以 把 关注 重点 放 在 源 服 务 
器 和 边缘 服务 器 ， 因 为 它们 是 网 络 设施 中 涉及 内 容 分 发 过 程 的 主要 部 分 。 解 决 可 扩展 
性 和 性 能 问题 的 两 个 经 典 思路 是 缓存 和 复制 。CDN 将 源 服 务 器 上 的 一 些 逻 辑 层 复制 
到 边缘 服务 器 上 。 如 前 面 所 述 ， 互 联网 系统 中 有 4 个 逻辑 层次 ， 因 此 可 以 考虑 以 下 4 
种 方法 ， 示 意图 见 图 4.3。 








Web 系 统 逻 辑 
层 在 CDN 的 复制 


— x 用 户 配置 层 
前 端 层 的 复制 的 复制 | 





图 4.3 CDN 设施 中 Web 逻辑 层 的 映射 


1. 前 端 层 的 复制 

这 是 第 一 代 CDN 使 用 的 典型 方法 。 在 该 方法 中 ， 边 缘 服务 器 (当时 称 为 代理 绥 
存 服务 器 ，surrogate server) 只 负责 静态 内 容 的 管理 ， 其 作用 类 似 反 向 代理 服务 器 
(reverse proxy) ， 实 现 内 容 分 发 的 加 速 (内 容 的 存储 可 以 在 文件 系统 级 实现 )55. 9 。 
被 复制 的 网 络 内 容 可 以 是 整个 网 络 对 象 (如 内 嵌 对 象 或 多 媒体 资源 ) ， 也 可 以 是 Web 
片段 (这 时 ， 复 制 可 以 使 用 更 精细 的 方法 )54 。 

2. 应 用 层 的 复制 . 

这 种 方法 也 称 边缘 计算 “ ， 是 把 网 络 应 用 程序 或 组 件 直接 转移 到 边缘 服务 器 
上 ,目的 是 在 接近 客户 端的 地 方 创建 动态 内 容 。 因 此 ，CDN 可 以 提高 动态 内 容 
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的 分 发 性 能 。 

3. 后 端 层 的 复制 

边缘 服务 器 不 仅 实 现 动 态 内 容 的 创建 ， 而 且 还 可 以 管理 创建 时 使 用 的 数据 。 源 服 
务 器 只 负责 网 络 设施 的 管理 ， 并 保存 数据 的 一 份 主 副本 。 

4. 用 户 配 置 层 的 复制 

边缘 服务 器 还 要 管理 用 于 产生 个 性 化 内 容 的 数据 库 ”” 。 


4.3 前 端 层 的 复制 


前 端 层 的 复制 是 为 了 提高 静态 内 容 分 发 时 的 性 能 和 可 扩展 性 。 如 图 4.4 所 示 ， 这 
些 内 容 缓存 在 CDN 边缘 服务 器 中 。 将 静态 





内 容 的 分 发 工作 转 由 边缘 服务 器 来 完成 ， E 

是 为 了 解决 可 扩展 性 的 问题 ， 因 为 这 样 做 源 服务 器 —. 

可 以 避免 出 现在 对 等 点 和 广域网 链 路 处 的 CERE 

网 络 拥堵 风险 ， 而 这 两 个 地 方 的 拥堵 是 网 缓存 的 资源 
络 延 时 的 主要 原因 cl 。 HET 


通过 使 用 一 个 第 三 方 的 网 络 设施 来 加 cade 
速 静态 内 容 的 分 发 ， 是 一 种 提高 内 容 分 发 ”网 络 边缘 ----------- 
性 能 的 常用 方法 。 这 种 做 法 可 以 追溯 到 第 ux. . 
一 代 CDN， 如 Adero CDN 或 Akamai 的 媒体 图 4.4 前 端 屋 向 边缘 服务 器 的 复制 
分 发 服务 上 。 不 过 ， 静 态 内 容 的 分 发 仍然 
是 一 个 棘手 的 工作 ， 因 为 富 媒 体 (rich - media)。 内 容 的 使 用 已 经 变 得 越 来 越 多 ， 它 
产生 的 流量 正在 成 为 互联 网 流量 的 一 个 重要 组 成 部 分 。 将 这 类 媒体 内 容 的 分 发 转移 到 
接近 客户 端的 地 方 ， 可 以 获得 很 大 的 好 处 ,原因 有 二 : 首先 ， 由 于 这 类 内 容 的 尺寸 庞 
大 ， 在 对 等 点 处 的 网 络 延 时 会 使 用 户 明 显 感 觉 到 性 能 的 下 降 ; 其 次 ,借助 常用 的 HT- 
TP 流 技术 可 以 降低 分 发 时 间 上 的 不 确定 性 ， 使 媒体 的 播放 变 得 更 加 流畅 29 。 

由 于 多 媒体 内 容 的 尺寸 较 大 ， 所 以 通常 只 把 每 个 多 媒体 内 容 中 用 户 最 感 兴趣 的 部 
分 (而 不 是 全 部 ) 缓存 在 边缘 服务 器 中 ”1 ， 称 分 段 缓存 (segment caching), WE 
4.4 所 示 。 一 个 多 媒体 资源 中 每 个 片段 (fragment) 的 受 欢 迎 度 由 用 户 的 访问 模式 决 
定 : 如 果 用 户 采 用 (从头) 连续 访问 的 模式 ， 那么 通常 使 用 连续 缓存 的 方法 ， 也 就 
是 存储 资源 的 起 始 部 分 ， 以 减 小 缓冲 时 间 ; 如 果 用 户 的 访问 模式 主要 是 媒体 中 的 随机 
定位 ， 那 么 就 要 使 用 不 同 的 缓存 技术 ， 如 交错 缓存 方法 ， 这 样 可 能 会 更 加 有 效 ” 。 

当 待 分 发 的 Web 内 容 是 由 片段 (fragment) 组 装 而 成 时 (ILES 4. 4 中 被 缓存 的 资 
源 ) ， 有 人 提出 了 将 流 内 容 分 割 为 段 (segment) 的 方法 。 这 个 方法 要 求 边缘 服务 器 做 


页 片 


O ”区别 于 单一 的 图 片 、 视 频 等 传统 媒体 ，rich - media 是 具有 复杂 视觉 效果 和 交互 功能 的 媒体 ， 可 以 
由 网 页 、 图 片 、 超 链接 、 在 线 视频 的 即时 播放 等 资源 组 合 而 成 。rich - media 丰富 了 网 络 媒体 的 内 容 ， 呈 现 
出 更 好 的 效果 ， 主 要 用 于 网 络 在 线 广告 等 。 国 内 一 般 译 为 “ 富 媒 体 "。 一 一 译 者 注 
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更 多 的 工作 ， 其 前 端 层 必 须 包 含 两 个 功能 : 为 每 个 片段 提供 单独 的 缓存 和 片段 的 组 
装 。 作 为 一 个 独立 的 信息 实体 ， 每 个 片段 可 以 包含 描述 其 缓存 能 力 的 配置 信息 ， 该 信 
息 用 来 指示 片段 能 否 被 缓存 和 它 在 网 络 上 的 存活 时 间 (Time -To-Live, TTL), ix3k 
可 以 在 片段 (而 不 是 在 网 页 ) 的 粒度 上 管理 内 容 的 新 鲜 度 ”和 生命 周期 。 

当 一 个 用 户 请 求 网 页 时 ， 边 缘 服 务 器 在 它 的 缓存 中 找到 该 网 页 的 片段 ， 然 后 立刻 
将 其 组 装 起 来 。 只 有 那些 失去 时 效 或 没有 被 缓存 的 片段 才 从 源 服务 器 取 。 因 此 ， 在 边 
缘 服务 器 上 使 用 基于 片段 的 缓存 和 动态 组 装 方法 ， 对 源 服 务 器 而 言 有 两 个 好 处 : 一 是 
它 不 必 完 成 组 装 页 面 的 任务 ; 二 是 它 一 般 只 需要 分 发 页 面 的 一 小 部 分 内 容 ， 也 就 是 边 
缘 服 务 器 上 那些 失效 或 缓存 中 没有 的 片段 。 对 于 大 部 分 由 动态 创建 的 网 页 构成 的 网 络 
资源 ， 基 于 片段 的 缓存 技术 可 以 在 距离 终端 用 户 最 近 的 互联 网 边缘 向 用 户 提 供 这 些 内 
容 ， 从 用 户 对 性 能 的 感受 可 以 发 现 ， 这 一 技术 已 被 证 明 能 够 有 效 地 改善 响应 时 
间 "”… 1。 不 仅 如 此 ， 这 一 技术 同样 对 边缘 服务 器 有 益 : 那些 被 不 同 网 页 共享 的 同一 
个 片段 只 需 保存 一 份 副本 ， 这 就 大 大 提高 了 磁盘 空间 的 利用 率 ; 同时 ， 它 也 能 够 降低 
边缘 服务 器 上 缓存 的 失效 频 度 ， 因 为 网 页 中 的 不 同 部 分 只 有 在 过 期 的 时 候 才 标记 为 
“失效 o 

衡量 基于 片段 的 缓存 技术 的 常用 标准 是 ESI (Edge Side Includes) ”，ESI 是 一 种 
基于 XML 的 标记 语言 ， 能 够 使 用 XML 来 区 分 内 容 是 否 应 该 缓存 。 内 容 提 供 商 根据 其 
开发 环境 制订 相应 的 ESI 规范 ， 用 来 设计 和 开发 业务 逻辑 以 实现 网 页 的 产生 和 装配 。 
除了 将 页 面 分 解 为 片段 这 一 基本 功能 ( 即使 在 一 个 有 条 件 的 方式 下 )，ESI 的 功能 还 
包括 片段 不 可 用 时 的 异常 处 理 ， 以 及 对 被 缓存 片段 的 失效 性 做 出 判断 ， 这 就 使 EST 可 
以 提供 比 TTL 机 制 更 强 的 一 致 性 确保 机 制 S 

基于 片段 的 网 页 发 布 和 缓存 技术 已 经 被 很 多 公司 和 商业 产品 使 用 ， 如 Akamai 公 
司 基 于 ESI 规范 的 EdgeSuite pay 22) ， 以 及 IBM 公司 的 WebSphere Edge Server’? 。 
Challenger 等 人 提出 了 一 个 基于 片段 方法 和 兼容 ESI 的 Web 发 布 系统 的 大 规模 部 署 方 
3UU, ， 这 个 系统 能 够 用 片段 构造 复杂 的 对 象 ， 安 装 在 IBM 托管 的 网 站 上 用 于 处 理 主 
要 的 体育 事件 。 在 参考 文献 [14] 中 ， 也 讨论 了 对 受 片段 变化 影响 的 网 页 进行 检测 和 
更 新 的 问题 。 该 文献 提出 的 方法 ， 是 根据 一 致 性 要 求 采 取 基 于 图 搜索 的 不 同 算法 。 
Yuan 等 人 研究 了 边缘 服务 器 上 的 4 种 不 同 的 缓存 和 负载 分 流 (offloading) WES, 
并 使 用 了 一 个 有 代表 性 的 电子 商务 基准 进行 了 评估 。 评 估 结 果 显 示 ， 一 个 简单 的 将 网 
页 分 解 功能 分 流 的 策略 ， 可 以 非常 有 效 地 降低 服务 器 的 负载 和 延 时 。 

大 多 数 支持 基于 片段 的 缓存 技术 的 边缘 服务 器 并 不 提供 缓存 之 间 的 任何 协作 ， 也 
就 是 说 ， 这 些 缓存 完全 被 作为 独立 的 实体 。 这 就 使 我 们 无 法 享受 协作 带 来 的 好 处 ， 而 
采取 协作 的 方式 可 以 使 边缘 服务 器 发 挥 其 潜在 的 缓存 能 力 。Akamai 的 EdgeSuite 在 这 
个 方向 上 进行 了 一 些 努力 ， 但 仅 限 于 边缘 服务 器 之 间 的 协作 上 。 最 近 ，Ramaswamy 等 
人 "在 大 范围 网 络 中 边缘 服务 器 的 协作 上 解决 了 一 些 重要 问题 ,他们 提出 了 基于 动态 


O 新 鲜 度 (freshness) 用 于 指示 数据 在 经 过 网 络 传输 后 是 否 保持 了 正确 性 。 一 一 译 者 注 
O 对 缓存 一 致 性 机 制 的 分 析 可 参见 第 5 章 。 一 一 原 书 注 
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哈 硕 的 文档 检索 /更 新 协议 的 低 成 本 协作 技术 ， 也 研究 了 如 何 实现 单个 边缘 服务 器 的 
失效 恢复 。 

基于 片段 的 方法 也 面临 着 一 些 问题 的 困扰 ， 包 括 与 动态 内 容 的 类 型 相关 的 应 用 
性 问题 以 及 网 页 的 片段 分 解 问题 ， 而 该 方法 的 主要 缺点 都 与 这 些 问题 有 关 。 的 确 ， 
如 果 用 户 的 请 求 序列 具有 高 度 的 局 部 性 ， 同 时 源 服务 器 上 的 内 容 更 新 不 频繁 ， 基 
于 片段 的 缓存 就 能 有 效 地 应 用 。 这 个 条 件 保证 了 片段 的 可 缓存 性 参数 足以 用 来 管 
理 内 容 的 新 鲜 度 ， 从 而 减轻 了 源 服务 器 给 缓存 中 的 片段 设置 “失效 ”标志 的 负担 。 
不 仅 如 此 ， 因 为 缓存 、 划 分 片段 、 组 装 片段 等 工作 都 是 在 每 一 个 具体 应 用 上 进行 ， 
所 以 该 技术 很 缺乏 透明 性 。 例 如 ， 由 于 ESI 代码 必须 加 到 原始 代码 上 ， 这 就 需要 完 
全 修改 网 页 的 代码 ， 因 此 EST 的 性 能 就 取决 于 网 页 的 结构 。 对 于 同时 为 多 个 内 容 提 
供 商 分 发 内 容 的 边缘 服务 器 来 说 ， 上 述 对 片段 的 人 工 辨识 和 标记 几乎 是 无 法 承受 
的 。 为 了 避免 采用 人 工 方式 将 网 页 划分 为 片段 ，Ramaswamy 等 "基于 对 动态 网 页 
的 详细 分 析 (根据 其 共享 行为 和 变化 模式 )， 提 出 了 一 个 自动 检测 网 页 中 片段 的 
方法 。 


44 应 用 层 的 复制 


如 果 在 CDN 中 只 复制 前 端 屋 ， 那 么 在 根据 互联 网 应 用 逻辑 产生 动态 内 容 的 源 服 
务 器 上 ， 应 用 层 就 成 为 一 个 性 能 上 的 瓶颈 。 应 用 层 复 制 ( 一般 称 为 边缘 计算 "™“!) 
的 目标 是 改善 动态 内 容 的 分 发 ， 采 取 的 方式 就 是 将 应 用 层 的 工作 从 源 服务 器 上 转移 出 
去 。 互 联网 应 用 的 代码 被 复制 到 多 个 边缘 服务 器 上 ， 但 数据 仍然 是 集中 管理 的 ， 只 是 
将 计算 工作 推 到 网 络 边 缘 ， 如 图 4.5 所 示 。 

在 边缘 计算 中 ， 每 个 边缘 服务 器 有 一 份 应 
用 代码 的 完整 副本 ， 而 后 端 层 仍然 在 源 服 务 器 
中 ， 也 就 是 说 ， 所 有 的 边缘 服务 器 继续 共享 一 
个 中 央 数 据 库 。 相 对 于 应 用 层 和 数据 层 采 取 集 
中 管理 而 只 复制 前 端 层 的 方法 ， 将 计算 任务 推 
到 网 络 边缘 可 以 降低 源 服 务 器 的 工作 负担 ， 使 


CDN 可 以 获得 更 好 的 效率 、 性 能 和 更 高 的 可 o; 
用 性 。 边缘 服务 器 ie 


根据 边缘 服务 器 区 分 事务 性 请 求 和 非 事务 
性 请 求 的 能 力 ， 可 以 确定 两 种 不 同 架 构 的 解决 Muk- - - | 
方案 。 一 个 事务 性 的 请 求 是 一 个 数据 库 操作 的 cum g 
原子 集合 ， 这 类 请 求 通常 是 给 数据 库 的 基部 分 图 4 5 应 用 层 向 边缘 服务 器 的 复制 
加 锁 并 修改 数据 库 中 的 记录 ; 而 非 事务 性 的 请 
求 对 数据 的 操作 方式 是 只 读 的 。 如 果 边 缘 服 务 
器 不 能 区 分 请 求 的 类 型 ， 则 边缘 服务 器 上 的 Web 服务 器 将 所 有 的 请 求 直 接 转 给 其 本 
地 应 用 层 处 理 ， 随 后 本 地 应 用 逻辑 访问 位 于 CDN 核心 上 的 中 央 数 据 层 。 如 果 边 缘 服 
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务 器 能 够 区 分 请 求 的 类 型 ， 则 它 只 把 非 事 务 性 的 请 求 转 到 本 地 应 用 层 ， 而 将 事务 性 请 
求 直 接 转 发 给 源 服务 器 上 的 应 用 层 ， 在 那里 处 理事 务 和 访问 集中 管理 的 数据 库 。 

在 应 用 层 复 制 的 方法 中 ， 一 般 由 CDN 核心 充当 协调 任务 ， 负 责 把 应 用 迁移 和 
(或 ) 复制 到 边缘 服务 器 上 ， 并 保持 对 副本 的 跟踪 。 有 时 CDN 核心 也 需要 负责 维护 这 
些 副本 与 原件 的 一 致 性 ， 为 了 实现 这 个 功能 ， 它 采取 一 个 简单 的 基于 服务 器 的 失效 性 
检查 ， 也 就 是 说 ， 当 原件 被 开发 人 员 修 改 后 负责 更 新 边缘 服务 器 上 的 副本 。 

边缘 计算 已 经 被 应 用 在 很 多 商业 产品 和 学 术 项 目 中 。 例 如 ， 它 是 Akamai 公司 开 
发 的 产品 EdgeComputing 的 核心 ”1] ， 该 产品 托管 那些 由 用 户 提供 安装 到 网 络 边缘 端的 
应 用 服务 器 上 的 J2EE 组 件 。EdgeComputing 使 用 一 个 两 级 模型 来 复制 应 用 层 : 包含 着 
表示 逻辑 的 JSPs 和 servlets 被 部 署 在 Akamai 网 络 的 边缘 服务 器 ， 而 业务 级 组 件 由 于 与 
后 端 层 或 数据 库 联系 紧密 ， 所 以 仍 放 在 源 服务 器 的 CDN KL. 

通过 多 年 的 研究 ， 进 程 的 迁移 问题 已 得 到 了 解决 。 一 个 应 用 在 复杂 系统 上 的 例子 
是 vMatrixP! ， 它 将 应 用 的 整个 动态 状态 从 一 台 服 务 器 迁移 到 另 一 台 服 务 器 ?。 不 过 ， 
Web 应 用 并 不 需要 在 任意 时 刻 进行 实际 的 应 用 迁移 ， 而 是 可 以 在 需要 的 时 候 进 行 ”。 
因此 ， 可 用 于 CDN 环境 下 的 一 个 明显 的 简化 方法 是 在 边缘 服务 器 进行 应 用 的 自动 部 
署 。Rabinovich 等 人 提 到 的 ACDN (Application CDN) 5 是 一 个 采用 这 一 自动 部 署 概 
念 的 应 用 分 布 框架 ， 根 据 需 要 在 统一 的 协调 下 进行 对 应 用 的 动态 复制 。 这 个 框架 的 实 
现 是 基于 一 个 元 文件 (meta - file) ， 该 文件 包含 构成 应 用 的 文件 列表 和 一 个 初始 化 
脚本 。 

由 Zhao 和 Schulzrinne ^?" #2 44 fj DotSlash 框架 是 另 一 个 学 术 项 目 ， 它 使 用 一 个 动 
态 脚本 复制 技术 来 管理 动态 内 容 。DeotSlash 并 不 是 为 大 规模 CDN 设计 的 ， 它 动态 地 提 
供 救援 服务 器 作为 缓存 代理 服务 器 ， 以 此 来 提供 一 个 系统 以 解决 对 网 站 性 能 造成 影响 
的 负载 瞬间 激增 问题 。 

应 用 层 复 制 的 特点 是 能 够 实现 那些 具体 和 特定 应 用 的 定制 化 ， 应 用 层 复制 的 方法 
既 不 是 通用 的 也 不 是 透明 的 。 它 需要 为 每 个 具体 的 应 用 实现 定制 化 ， 因 为 它 需要 通过 
人 工 配 置 决定 哪些 组 件 要 被 转移 以 及 在 哪里 部 署 应 用 。 例 如 ， 在 前 面 提 到 的 ACDN 
中 ， 应 用 可 以 动态 地 部 署 及 重新 部 署 ， 但 仍然 需要 人 工 的 干预 ， 如 为 每 个 需要 复制 的 
应 用 创建 元 文件 。 应 用 的 定制 化 会 大 大 增加 其 管理 者 的 成 本 ， 而 且 编写 过 程 中 也 容易 
引入 拼写 之 类 的 错误 。 参 考 文献 [33] 在 自动 判断 如 何 进 行 互联 网 应 用 的 复制 方面 做 
出 了 一 些 研究 。 不 过 ， 这 些 研 究 主要 是 着 眼 于 小 规模 的 情况 ， 可 能 不 适用 于 那些 有 成 
千 上 万 个 边缘 服务 器 的 大 规模 CDN, 

应 用 层 复 制 方法 面临 的 其 他 不 足 之 处 与 源 服务 器 对 数据 的 集中 管理 有 关 。 这 种 对 
数据 进行 集中 管理 的 架构 有 两 个 缺点 : 首先 ， 在 一 个 大 规模 CDN H, 边缘 服务 器 之 
间距 离 很 远 ， 每 次 数据 访问 都 会 发 生 广域网 延 时 ; 其次， 中央 数 据 库 可 能 很 快 就 会 成 


O 在 该 方法 中 ， 借 助 一 个 VMM (Virtual Machine Monitor) 的 概念 ， 将 计算 机 A 的 状态 ( CPU、 操作 
系统 、 代 码 、 库 等 信息 ) 封装 到 一 个 VM (Virtual Machine) 文件 中 ， 和 凭借 VM 文件 就 能 够 在 同样 运行 VMM 
软件 的 计算 机 B 上 ， 将 计算 机 A 实例 化 和 模拟 。 这 样 就 解决 了 代码 对 其 编译 环境 的 依赖 问题 。 一 一 译 者 注 
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为 一 个 性 能 上 的 瓶 诺 ， 因 为 它 需 要 响应 整个 系统 中 对 数据 库 的 所 有 请 求 。 因 此 ， 应 用 
层 复制 方法 只 适用 于 那些 对 中 央 数 据 库 访问 极 少 的 网 站 。 

高 度 集中 的 数据 层 管理 方式 限制 了 整个 CDN 的 可 扩展 性 ， 下 一 节 将 讨论 其 他 一 
些 方法 ， 这 些 方法 旨 在 缓解 数据 集中 管理 导致 的 瓶颈 问题 。 因 此 ， 进 一 步 的 措施 是 在 
数据 层 使 用 缓存 和 复制 技术 ， 从 而 将 源 服务 器 的 功能 转移 到 边缘 服务 器 。 


4.5 后 端 层 的 复制 


因为 在 一 些 互联 网 应 用 中 ， 瓶 颈 位 于 后 端 层 "” 而 非 应 用 层 ， 所 以 边缘 计算 方法 
可 能 无 法 解决 每 一 个 可 扩展 性 问题 。 在 这 种 情况 下 ， 为 了 解决 可 扩展 性 问题 ， 可 以 将 
应 用 数据 交 给 一 个 第 三 方 (CDN) 来 管理 ， 由 CDN 代替 源 服 务 器 的 后 端 层 对 边缘 服 
务 器 应 用 层 发 出 的 数据 查询 做 出 响应 。 

很 多 学 者 从 数据 库 的 角度 对 数据 复制 方案 进行 了 广泛 的 研究 。 在 本 节 中 ， 分 
析 的 范围 仅 限于 对 Web 系统 后 端 层 数 据 的 复制 。 参 考 文献 [43] 对 这 个 范围 内 的 各 种 
方法 进行 了 总 结 : 对 于 存储 在 后 端 层 的 数据 ， 其 复制 可 以 是 完整 的 也 可 以 是 部 分 的 ， 
如 图 4. 6 所 示 。 数 据 的 部 分 复制 可 以 通过 两 种 方式 实现 : 一 是 将 大 部 分 常见 的 对 数据 
库 操 作 (query) 的 返回 结果 进行 缓存 〈 内 容 未 知 的 缓存 ) ; 二 是 主动 地 复制 后 端 层 
的 部 分 数据 ， 选 择 复制 哪些 数据 取决 于 使 用 模式 、 网 络 和 基础 设施 的 状态 “ (内容 
已 知 的 缓存 ) 。 


WA [Es = 
复制 策略 





NH Ve Sc E ERU 


hs 内 容 未 知 的 缓存 

— [1 e (查询 级 存 ) 

Me 一 一 内 容 已 知 的 缓存 
aug g (数据 库 部 分 复制 ) 


图 4.6 后 端 层 向 边缘 服务 器 的 复制 


由 于 互联 网 应 用 对 数据 库存 在 不 同 的 访问 模式 ， 所 以 不 能 简单 地 认定 哪些 方法 最 
f. Gao 等 人 在 参考 文献 [22] 中 提出 的 不 同 复制 策略 ， 取 决 于 不 同 Web 应 用 的 特性 。 


4.5.1 内 容 未 知 的 缓存 


在 这 种 缓存 策略 下 ， 边 缘 服 务 器 中 被 缓存 的 数据 是 前 一 次 对 数据 库 操作 的 返回 结 
果 。 这 样 ， 当 再 次 收 到 相同 或 类 似 的 请 求 时 ， 服 务 器 就 可 以 在 本 地 对 其 处 理 ， 这 不 仅 
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改善 了 性 能 ， 也 能 减轻 源 服务 器 后 端 层 的 负担 。 

这 种 通过 缓存 数据 库 操作 结果 来 实现 后 端 层 复 制 的 方法 使 用 得 非常 广泛 ， 如 Glo- 
beCGC' 系统 。 近 来 ， 有 学 者 设想 通过 该 缓存 机 制 实现 后 端 层 的 动态 复制 ， 从 而 可 以 
改善 可 扩展 性 。 例 如 ， 当 出 现 预期 之 外 的 流量 激增 时 ，DotSlash 框架 的 QCache 模 
Be) 使 用 一 个 网 站 合作 协议 临时 启用 一 个 分 布 式 的 缓存 设备 以 减轻 过 载 状况 。 

对 数据 库 操 作 结 果 进 行 缓存 的 效果 取决 于 缓存 命中 率 。 为 了 提高 命中 率 ， 可 能 需 
要 放宽 缓存 机 制 中 对 内 容 特性 的 要 求 。 为 此 ， 可 以 使 用 稍微 复杂 一 些 的 匹配 引擎 : 在 
处 理 一 个 新 的 数据 库 操 作 时 使 用 缓存 中 已 有 的 结果 进行 响应 ， 而 不 是 由 源 服 务 需 处 
理 。DBproxy" 的 一 个 独特 之 处 就 是 提供 了 对 这 个 匹配 引擎 的 支持 。 参 考 文献 [30] 中 
提出 了 一 个 有 效 合 并 缓存 数据 的 方法 ， 即 每 次 数据 库 操作 的 结果 被 加 入 到 后 端 数 据 库 
的 一 个 (初始 为 空 的 ) 副本 中 。DBCache'" 在 表 的 层面 上 支持 数据 库 的 缓存 ， 人 允许 
在 边缘 服务 器 上 缓存 中 央 数 据 库 服 务 器 中 那些 表 的 整个 内 容 或 一 个 子 集 。 

缓存 机 制 应 该 确保 缓存 数据 的 一 致 性 。 既 然 传统 的 基于 TTL 的 方法 无 法 对 每 个 
Web 应 用 都 适用 ， 因 此 出 现 了 一 些 与 特定 应 用 相关 的 一 致 性 增强 机 制 。 例 如 ，Olston 
等 人 使 用 一 个 多 播 消息 系统 将 数据 失效 的 消息 发 送 到 每 个 缓存 ”， 而 Tolia A E 
用 哈 希 函数 确保 不 会 使 用 失效 的 数据 。 

在 边缘 服务 器 上 实现 对 数据 库 操作 结果 的 缓存 是 一 个 重要 的 特性 ， 目 前 被 用 于 很 
多 的 商业 产品 ， 包 括 BEA WebLogic 和 IBM Web - Sphere。 特 别 是 IBM Web - Sphere, 
它 通 过 一 个 物化 查询 表 (Materialized Query Table, MQT) 实现 对 数据 库 操作 结果 的 缓 
存 。MQT 是 一 张 表 ， 存 储 预先 计算 的 对 一 个 或 多 个 数据 库 表 的 操作 结果 。 在 创建 和 
填写 MQT 之 后 ， 对 于 随后 收 到 的 一 个 任意 的 数据 库 请 求 ， 如 果 MOT 对 它 实 现 了 全 部 
或 部 分 的 匹配 ， 那 么 这 个 数据 库 请 求 就 得 到 了 满足 。BEA WebLogic 借助 EJB 提供 了 
一 个 类 似 的 功能 。 

即使 采取 了 一 些 一 致 性 增强 机 制 ， 网 络 设施 中 的 网 络 层 也 可 能 会 导致 边缘 服务 器 
上 的 数据 相对 于 中 央 数 据 层 的 当前 状态 而 言 是 失效 的 。 这 对 于 以 读 为 主 的 应 用 场合 
(在 这 里 ， 网 络 应 用 几乎 不 需要 执行 事务 性 操作 ) 也 许 不 是 个 问题 。 但是， 对 于 一 类 
重要 的 应 用 (如 涉及 支付 操作 ) ， 事 务 性 操作 是 必须 存在 的 ， 数 据 库 的 修改 也 是 频繁 
的 。 在 这 种 情况 下 ， 对 数据 库 操作 结果 的 缓存 可 能 就 不 再 是 一 个 可 行 的 选择 。 而 且 ， 
数据 库 缓存 技术 只 是 对 那些 在 数据 层 反 复 执行 相同 操作 的 应 用 来 说 是 适用 的 ， 而 对 于 
那些 不 具备 这 种 时 间 局 部 性 的 应 用 ， 对 边缘 服务 器 数据 层 进行 部 分 或 全 部 复制 可 能 会 
更 有 效 。 


45.2 内 容 已 知 的 缓存 


在 基于 内 容 已 知 的 缓存 技术 中 ， 每 一 个 边缘 服务 器 运行 自己 的 数据 库 服务 器 ， 该 
服务 器 包含 一 个 中 央 数 据 库 的 部 分 视图 。 部 分 数据 复制 的 典型 方法 是 根据 访问 模式 将 
数据 库 的 一 部 分 转移 到 边缘 服务 器 。 既 然 目 标 是 降低 对 用 户 请 求 的 响应 时 间 ， 那 么 在 
决定 副本 放置 的 算法 中 (如 HotZone 算法 ) ， 通 常 要 在 性 能 建 模 时 考虑 网 络 延 时 rm 。 

复制 机 制 的 一 个 典型 的 例子 是 GlobeDB (el ， 它 在 数据 分 区 对 数据 库 进 行 部 分 的 
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复制 ， 以 降低 因数 据 库 内 容 修 改 而 产生 的 流量 。 但 是 ， 这 个 方案 需要 一 个 拥有 完整 数 
据 库 的 特定 服务 器 去 执行 复杂 的 数据 库 操作 ， 因 此 这 个 服务 器 可 能 会 成 为 新 的 吞吐 量 
瓶颈 。GlobeTB ”对 GlobeDB 进行 了 改进 ， 不 仅 要 减 小 延 时 ， 同 时 还 要 增加 被 复制 数 
据 库 的 吞吐 量 。 为 此 ，GlobeTP 降低 了 对 单一 中 央 主 数据 库 的 要 求 ， 避 免 在 源 服务 器 
的 后 端 层 出 现 瓶颈 风险 。 

与 前 述 对 数据 库 操作 结果 的 缓存 一 样 ， 对 数据 库 做 部 分 的 复制 也 可 能 面临 一 致 性 
的 问题 。 参 考 文献 [35] 引入 中 间 件 Ganymed 来 解决 在 被 复制 的 后 端 层 面临 数据 变化 
( 即 接收 到 修改 、 删 除 、 插 入 的 指令 ) 时 如 何 确保 数据 一 致 性 的 问题 ，Ganymed 把 修 
改 操 作 与 只 读 类 事务 分 开 ， 将 前 者 转 到 一 个 中 央 主 数据 库 服务 器 处 理 ， 而 将 后 者 交 由 
只 读 的 数据 库 副 本 处 理 。 

很 多 商业 产品 也 支持 数据 库 的 部 分 复制 。 例 如 ，mySQL 数据 库 管 理 系统 支持 多 
个 副本 的 数据 分 区 ，IBM DB2 和 Oracle 也 具有 类 似 的 特性 。 不 过 ， 在 大 多 数 情况 下 ， 
数据 库 部 分 复制 的 方案 被 设计 用 于 对 资源 ( 即 数据 库 集群 ) 的 一 个 本 地 副本 进行 管 
H, 需要 在 所 有 数据 库 分 区 之 上 有 一 个 中 央 管 理 器 来 处 理 和 分 发 请 求 和 事务 。 这 个 方 
法 不 能 直接 应 用 于 一 个 大 范围 网 络 内 资源 的 复制 ， 因 为 一 个 中 央 管 理 器 的 存在 会 影响 
系统 的 可 扩展 性 。 由 于 这 个 原因 ， 大 多 数 商业 产品 更 多 地 依靠 对 数据 库 操 作 结 果 的 组 
存 而 不 是 数据 库 复 制 策略 。 


4.5.3 数据 库 整体 复制 


服务 器 整体 复制 机 制 负责 维护 数据 的 所 有 副本 在 每 个 位 置 上 的 一 致 性 。 通 过 将 服 
务 器 的 副本 转移 到 若干 个 边缘 服务 器 中 ， 并 保持 数据 库 的 所 有 这 些 副 本 相互 一 致 ， 那 
么 就 有 可 能 在 无 须 修改 每 一 个 应 用 的 前 提 下 在 网 络 的 边缘 完全 实现 动态 内 容 的 分 发 。 
不 过 ， 对 数据 库 复制 的 管理 也 存在 严重 的 一 致 性 维护 问题 ， 当 客户 端的 请 求 使 数据 被 
频繁 修改 时 这 个 问题 的 解决 就 显得 尤为 重要 。 这 是 一 个 众所周知 的 问题 ， 数 据 库 研究 
人 员 长 期 以 来 一 直 在 试图 解决 这 个 难题 。 

按照 习惯 做 法 ， 数 据 复制 是 通过 延 时 (lazy) 或 即时 (eager) 写 更 新 传播 来 实 
QU”, 在 即时 (或 称 同步 ) 方法 中 ， 副 本 之 间 的 数据 同步 发 生 在 事务 提交 之 前 ; 而 
在 延 时 方法 中 ， 数 据 的 更 新 则 是 在 事务 提交 后 才 进行 传播 。 即 时 方法 有 较 好 的 容错 
性 ， 而 且 提 供 了 与 单个 数据 库 相 同 的 正确 性 保证 。 但 是 ， 它 在 性 能 和 可 扩展 性 方面 可 
能 会 变 得 不 实用 ， 从 而 使 其 面临 着 很 严重 的 局 限 性 ”: 。 另 外 ， 延 时 方法 有 很 好 的 性 
能 和 可 扩展 性 ， 因 而 在 商业 产品 上 受到 青睐 。 但 延 时 方法 带 来 了 一 些 新 的 问题 : 因为 
事务 可 能 会 读 到 失效 的 数据 ， 且 更 新 事务 之 间 的 冲突 可 能 会 很 晚 才 被 发 现 ， 这 就 需要 
对 潜在 的 冲突 问题 进行 解决 。 

在 Web 环境 下 ,管理 数据 库 复制 最 简单 的 方法 是 基于 源 服务 器 中 的 原件 和 边缘 
服务 器 中 的 副本 。 只 读 业 务 完全 可 以 由 边缘 服务 器 通过 访问 其 数据 库 副 本 来 完成 。 不 
过 ， 对 于 需要 执行 更 新 操作 的 事务 (以 写 为 主 的 场合 ) ， 所 有 对 数据 库 的 访问 都 被 重 
定向 到 源 服务 器 中 数据 库 的 原件 上 ， 这 个 中 央 数 据 库 再 将 需要 更 新 的 数据 定期 传播 到 
边缘 服务 器 中 的 副本 。 这 种 方法 的 一 个 缺点 是 ， 边 缘 服务 器 必须 清楚 应 用 的 含义 ， 因 
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为 它 需 要 知道 请 求 触发 的 是 更 新 事务 还 是 只 读 事 务 。 不 仅 如 此 ， 这 个 解决 方案 中 数据 
副本 间 的 一 致 性 是 通过 延 时 更 新 传播 方法 实现 的 ， 这 带 来 两 个 不 利 影响 : 首先 ， 边 缘 
服务 器 中 存储 的 数据 可 能 会 失效 ; 其次， 一 次 崩溃 可 能 会 导致 数据 的 丢失 。 

在 Web 环境 中 ， 数据库 完全 复制 面临 很 多 挑战 。 到 目前 为 止 ， 很 多 数据 库 复制 
技术 都 假设 数据 库 副本 之 间 通 过 局 域 网 互联 。 近 年 来 ,数据库 研究 人 员 提 出 了 很 多 复 
制 协议 ,保证 数据 在 局 域 网 中 的 一 致 性 和 较 好 的 性 能 。 对 于 Web MSE, AW Riek 
了 一 些 解决 本 地 分 布 式 Web 系统 下 数据 库 复 制 的 研究 工作 。 有 兴趣 的 读者 可 以 参见 
参考 文献 [31] ， 该 文献 基于 组 通信 对 数据 库 复 制 系统 进行 了 全 面 的 分 析 。Amza 等 
人 "提出 的 延 时 复制 方案 ,可 以 通过 减少 冲突 的 数量 提供 序列 化 能 力 和 吞吐 量 定 级 。 
这 一 早期 工作 目前 已 经 有 了 分 布 式 的 版 本 ,能 够 提供 很 强 的 一 致 性 并 避免 死 锁 问 
BiU, 在 该 学 者 的 最 近 一 篇 文献 中 ,研究 了 如 何 将 数据 库 操作 结果 的 缓存 和 集群 复制 
方案 进行 结合 ”。 参 考 文献 [34] 使 用 一 个 中 间 件 来 实现 一 致 和 可 扩展 的 数据 复制 。 

在 CDN 中 ,数据 库 的 副本 在 地 理 上 分 布 于 一 个 WAN 中 ， 如 果 Web 应 用 产生 了 大 
量 的 数据 库 更 新 ， 随 之 而 来 的 巨大 流量 将 会 使 WAN 出 现 过 载 并 对 性 能 产生 负面 影响 ， 
这 是 因为 每 个 更 新 都 要 被 传播 到 所 有 其 他 的 副本 以 保证 所 有 副本 数据 的 一 致 性 。 参 考 文 
献 [31] 对 那些 通过 组 通信 实现 WAN 中 数据 一 致 性 的 数据 复制 技术 进行 了 性 能 分 析 ， 不 
过 ， 该 文献 中 对 可 扩展 性 的 分 析 只 限于 8 个 副本 。 因 此 ， 可 以 得 出 结论 : WAN 中 数据 
库 复 制 的 可 扩展 性 和 性 能 大 体 上 仍 是 一 个 尚 待 解决 的 问题 ， 还 需要 进一步 的 研究 。 


46 用 户 配 置 层 的 复制 


用 户 配置 层 取决 于 一 个 实现 数据 存储 的 数据 库 ， 即 后 端 层 。 因 此 ， 对 用 户 配 置 
信息 复制 的 可 能 方法 已 经 在 4.5 节 描 述 。 但是， 这 一 层 的 访问 模式 与 后 端 层 显著 
不 同 。 

特别 地 ， 用 户 通常 只 与 边缘 服务 器 交互 ， 因 此 在 某 个 用 户 与 网 站 之 间 的 整个 交互 
期 间 ， 用 户 的 配置 信息 只 被 一 个 边缘 服务 器 访问 。 这 种 访问 模式 对 一 致 性 和 复制 策略 
产生 了 重大 影响 。 事 实 上 ， 根 据 用 户 的 访问 模式 ， 全 部 用 户 的 配置 信息 可 以 被 分 割 并 
分 布 在 各 个 边缘 节点 上 。 既 然 不 需要 复制 ， 那 么 一 致 性 问题 就 变 成 只 需 确保 用 户 配置 
信息 在 边缘 服务 器 和 源 服 务 器 之 间 的 一 致 性 。 因 此 ， 管 理 用 户 配 置信 息 的 主要 方法 也 
就 仅 限于 对 前 面 提 到 的 内 容 未 知 的 数据 或 内 容 已 知 的 数据 的 缓存 ， 因 为 复制 整个 数据 
库 显然 是 不 必要 的 。 

然而 , 需要 指出 的 是 ， 即 使 用 户 在 整个 会 话 期 间 只 访问 一 个 边缘 服务 器 ,但 由 于 
用 户 完全 有 可 能 在 下 一 个 会 话 时 转移 到 另 一 个 边缘 服务 器 ， 所 以 有 必要 确保 用 户 的 配 
置信 息 在 用 户 转移 到 另 一 个 边缘 服务 器 时 跟着 迁移 过 去 ， 如 图 4. 7 所 示 。 在 大 部 分 的 
后 端 层 数据 复制 策略 中 ， 对 这 种 情况 的 支持 并 没有 得 到 优化 。 近 年 来 ， 一 些 研究 工作 
试图 解决 这 个 配置 信息 迁移 的 问题 。CONCA"" 是 一 个 通用 的 数据 缓存 框架 ， 目 的 是 
通过 允许 数据 随 用 户 迁 移 来 支持 用 户 的 移动 性 。 这 个 框架 已 得 到 进一步 扩展 ， 以 实现 
Tuxedo 中 个 人 数据 的 管理 ” 。 
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图 4.7 用 户 配 置 层 向 边缘 服务 器 的 复制 


除了 用 户 相关 信息 的 复制 ， 用 户 配置 层 必须 完成 的 关键 操作 还 包括 这 类 信息 的 创 
建 和 更 新 。 目 前 ， 用 户 配置 信息 的 更 新 或 者 由 用 户 通 过 Web 表单 的 方式 手动 更 新 ， 
或 者 基于 用 户 的 行为 方式 通过 Web 系统 自动 更 新 。 用 户 配置 信息 的 存储 和 收集 方式 
取决 于 所 采用 的 Web 服务 。 下 面 将 讨论 产生 个 性 化 内 容 的 一 些 典 型 的 例子 。 

1. 通过 外 部 数据 源 的 集合 产生 个 性 化 内 容 

这 种 服务 被 很 多 个 性 化 门户 网 站 (A myYahoo, iGoogle) 采用 ， 向 用 户 提供 个 性 
化 的 新 闻 源 ， 典 型 的 方式 是 通过 XML - RSS 从 异 构 数 据 源 获取 。 用 户 配置 信息 包含 
对 用 户 有 用 的 信息 以 及 个 性 化 内 容 的 提交 方式 。 当 用 户 在 个 性 化 门户 网 站 注册 时 ， 用 
户 通过 填写 网 页 上 的 表单 提供 与 新 闻 源 订阅 相关 的 信息 以 及 他 们 所 喜好 的 信息 显示 
格式 。 

2. 协同 过 滤 

这 种 服务 支持 用 户 之 间 的 交互 ， 允 许 用 户 对 其 他 用 户 和 话题 做 出 反馈 。 这 种 个 性 
化 内 容 产生 方式 通常 用 于 建议 系统 ， 该 系统 根据 对 类 似 用 户 行为 的 分 析 或 用 户 在 社交 
网 络 中 的 信誉 级 别 ， 为 购买 商品 提供 建议 。 用 户 信息 的 收集 有 各 种 方式 ， 或 通过 用 户 
输入 (例如 ， 在 这 样 的 情况 下 用 户 的 信誉 是 基于 其 他 用 户 的 反馈 ) ， 或 通过 间接 的 信 
息 采 集 。 例 如 ， 按 照 预先 确定 的 配置 信息 ， 通 过 挖掘 用 户 的 购买 行为 来 对 用 户 群 进行 
4287, 

3. 位 置 和 基于 环境 的 服务 

这 种 服务 根据 用 户 的 地 理 位 置 来 产生 个 性 化 内 容 。 通 过 对 数据 相关 信息 的 分 析 或 
用 户 访问 服务 时 提供 的 信息 ， 来 确定 用 户 的 位 置 。 将 用 户 所 处 的 位 置 与 地 理 数 据 进行 
比较 ， 根 据 用 户 的 位 置 和 周围 环境 (可 能 还 结合 用 户 的 偏好 ) 进行 用 户 静 态 和 动态 
内 容 的 产生 和 分 发 。 

这 些 例子 表明 ， 即 使 有 些 信息 是 由 用 户 提供 的 ， 但 存储 在 用 户 配置 信息 中 的 相当 
一 部 分 数据 是 通过 日 志文 件 的 数据 挖 气 、cookie 和 用 户 单 击 历史 来 推断 的 。 以 现 有 的 
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信息 收集 技术 ,可 以 提取 用 户 的 一 些 令 人 感 兴趣 的 信息 ， 包 括 敏感 数据 ， 如 政治 、 身 
体 状 况 和 性 别 特征 。 此 外 ， 大 多 数 的 技术 对 用 户 来 说 几乎 是 透明 的 ， 用 户 在 使 用 网 络 
服务 时 往往 完全 没有 意识 到 其 存在 。 近 几 年 出 现 了 一 些 未 经 授权 的 用 户 信息 收集 活 
动 ， 如 doubleclick. com 商业 广告 服务 。 一 些 商 业 服 务 (如 搜索 引擎 ) 均 与 double- 
click. com 有 关 。 商 业 站 点 使 用 cookie 来 监视 其 访客 的 活动 ， 收 集 的 任何 资料 都 存储 
在 doubleclick. com 数据 库 中 。 然 后 ， 这 些 用 户 信息 被 doubleclick. com 用 来 选择 更 适合 
用 户 的 广告 条 。 

滥用 个 人 信息 的 现象 引起 了 人 们 对 下 述 问题 的 关注 : 是 否 应 该 和 如 何 让 用 户 知道 
自己 的 信息 正在 被 收集 。 由 日 志 数 据 的 控 掘 和 cookie 的 分 析 引 发 的 对 隐私 问题 的 关 
注 ， 促 进 人 们 研究 新 的 机 制 来 确定 什么 样 的 信息 可 以 从 用 户 的 行为 中 提取 出 来 以 及 应 
该 如 何 使 用 。 隐 私 偏好 选项 平台 (Platform for Privacy Preferences, P3P) ^ 是 一 个 旨 在 
解决 这 一 问题 的 方案 : 每 个 遵守 P3P 标准 的 网 站 必须 提供 一 个 XML 格式 的 描述 ， 规 
定 收集 哪些 数据 、 数 据 如 何 管理 、 数 据 应 该 存储 在 哪里 。 完 全 遵守 P3P 标准 会 对 用 
户 配 置信 息 的 自动 复制 产生 一 些 限制 ， 因 为 必须 确保 每 个 用 户 配 置信 息 的 副本 都 应 该 
有 一 个 适当 的 访问 级 别 ， 这 样 才能 有 效 地 保护 用 户 的 隐私 。 


4.7 结论 和 尚 待 解决 的 问题 


静态 和 动态 内 容 的 分 发 可 以 由 一 个 第 三 方 ( 即 CDN) 通过 复制 Web 系统 中 的 
一 些 层 来 实现 加 速 。 本 章 对 Web 系统 中 每 个 逻辑 层 的 复制 进行 了 分 析 。 对 于 每 一 
层 ， 本 章 讨论 了 内 容 分 发 领域 的 研究 成 果 ， 同 时 也 说 明了 CDN 行业 如 何 使 用 复制 
技术 提高 内 容 分 发 的 效率 。 本 章 的 分 析 表 明 ， 当 内 容 提 供 商 想 加 速 静 态 多 媒体 内 
容 的 分 发 时 ， 前 端 层 的 复制 是 一 个 合适 的 选择 ; 而 如 果 CDN 用 来 加 速 动 态 内 容 的 
分 发 ， 则 需要 进行 应 用 层 的 复制 。 复 制 方法 对 性 能 的 提高 取决 于 对 数据 的 访问 模 
式 ， 对 于 某 些 Web 应 用 来 说 后 端 层 可 能 是 一 个 瓶颈 ， 这 时 就 必须 对 后 端 层 进行 
复制 。 

在 内 容 分 发 的 研究 中 存在 着 若干 有 待 解决 的 问题 。 事 实 上 ， 即 使 一 些 加 速 动态 内 
容 分 发 的 方法 已 经 提出 并 被 业界 接纳 ， 这 些 办 法 的 有 效 性 在 很 大 程度 上 也 仍 极 大 地 取 
决 于 应 用 的 访问 模式 。 特 别 地 ， 存 在 于 后 端 层 的 瓶颈 风险 仍 是 阻碍 动态 Web 内 容 分 
发 可 扩展 性 的 一 个 主要 问题 。 由 于 Web 内 容 和 应 用 的 发 展 ， 这 个 问题 即使 在 未 来 几 
年 也 很 可 能 仍 是 一 个 主要 的 研究 课题 。Web 2.0 正 推 动 Web 向 两 个 主要 趋势 发 展 : 越 
来 越 多 的 个 性 化 内 容 和 产生 大 量 上 传 流量 的 Web 新 使 用 模式 。 个 性 化 的 〈 和 不 可 组 
存 的 ) 内 容 和 内 容 的 高 更 新 率 降低 了 缓存 机 制 的 效率 ; 而 数据 一 致 性 协议 的 使 用 导 
致 了 维护 成 本 的 增长 。 此 外 ， 用 户 个 人 信息 的 存在 ， 引 出 了 用 户 配置 信息 中 哪些 允许 
复制 、 哪 些 不 允许 复制 的 边界 问题 ， 因 为 内 容 提 供 商 必须 保护 用 户 敏感 信息 的 私密 
性 。 随 着 Web 2.0 的 发 展 和 用 户 移动 性 的 普遍 ， 用 户 在 边缘 节点 之 间 移 动 ， 访 问 的 局 
部 性 将 被 打破 ， 这 就 使 情况 的 复杂 性 进一步 增加 。 对 于 CDN 运营 商 和 内 容 分 发 策略 
的 研究 者 来 说 ， 应 对 这 一 发 展 变化 将 是 他 们 面临 的 下 一 个 挑战 。 
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第 5 章 CDN 模拟 框架 的 缓存 技术 


Konstantinos Stamos, George Pallis 和 Athena Vakali 
5.1 引言 


很 明显 ， 在 新 的 Web 时 代 ， 人 们 最 关注 的 不 再 是 仅 由 文本 和 图 片 构 成 的 静态 页 
面 ， 而 是 内 容 的 数量 和 服务 的 可 用 性 。 就 内 容 分 发 而 言 ， 大 多 数 服 务 提 供 商 更 关注 服 
务 的 质量 。 在 这 种 情况 下 ， 代 理 服务 器 和 内 容 分 发 网 作为 两 种 不 同 的 技术 解决 这 个 问 
题 ， 其 共同 目标 是 使 内 容 贴近 用 户 及 减少 了 响应 时 间 。 

上 述 两 种 技术 具有 不 同 的 优 缺 点 。CDN 的 主要 特点 是 能 够 鲁 棒 地 对 大 量 的 请 求 
和 内 容 提供 服务 。 两 者 的 主要 缺点 是 ， 由 于 复制 和 分 发 的 成 本 ， 内 容 副 本 的 放置 在 大 
多 数 情况 下 都 采用 静态 的 方式 ， 代 理 缓 存 服务 器 (surrogate server) 不 得 不 保存 一 些 
宛 余 的 、 可 能 过 时 的 或 用 户 不 需要 的 内 容 ， 这 就 造成 存储 资源 的 利用 无 法 实现 最 优 
化 。 另 外 ， 代 理 服务 器 (proxy server) 根据 不 同 的 用 户 访问 模式 ， 使 用 缓存 置换 算法 
调整 对 内 容 的 缓存 。 但 是 ， 代 理 服 务 器 不 能 很 好 地 应 对 大 量 的 数据 和 庞大 的 用 户 群 。 
为 了 结合 两 者 的 优点 ,一些 近 期 的 研究 工作 ”“”” ”对 缓存 方法 进行 了 探索 。 随 着 新 
的 缓存 方法 的 出 现 ，CDN 明显 需要 一 个 用 于 性 能 评估 和 压力 测试 的 平台 。 这 个 平台 
应 该 提供 一 个 联网 环境 ， 其 中 包含 CDN 组 件 、 客 户 端 、 流 量 以 及 对 部 署 缓存 策略 的 
足够 支持 。 

虽然 理想 情况 下 应 该 是 在 实际 的 网 络 和 CDN 中 验证 提出 的 缓存 策略 ， 但 这 并 不 
总 是 可 行 和 合适 的 。 从 零 开 始 构建 一 个 真实 的 CDN 环境 是 不 现实 的 ， 因 为 它 需 要 高 
昂 的 建设 成 本 。 不 仅 如 此 ， 其 配置 工作 也 是 极其 烦琐 的 ， 涉 及 流量 模式 、 链 路 的 速 
度 、 网 络 拓扑 和 协议 等 很 多 参数 。 增 加 一 个 新 的 缓存 策略 需要 对 其 运行 环境 中 的 各 种 
网 络 资源 进行 大 规模 的 修改 。 另 外 ， 商 业 CDN 的 私有 性 通常 也 很 难 用 于 研究 目的 。 
最 后 ， 在 一 个 真实 世界 的 框架 中 进行 实验 也 不 那么 简单 ， 因 为 其 中 存在 着 很 多 不 可 控 
的 因素 〈 如 随机 噪声 和 外 部 网 络 流量 ) ， 这 都 会 使 实验 结果 不 可 再 现 。 

为 了 克服 现实 世界 模型 所 带 来 的 困难 ， 可 以 建立 仿真 模型 。 仿 真 模型 在 这 里 是 指 
支持 Web 缓存 的 CDN， 模 型 本 身 必须 实现 下 面 两 者 的 平衡 ， 即 精确 地 表达 现实 世界 
的 模型 和 合理 的 资源 管理 (执行 时 间 和 内 存 占用 ) 。 另 外 ， 该 模型 应 该 提供 一 个 基本 
的 平台 ， 可 以 方便 地 加 入 CDN 部 件 、 客 户 端 、 流 量 、 服 务 、 内 容 的 类 型 ， 特 别 是 组 
存 策略 。 缓 存 策略 在 配置 和 多 样 性 上 存在 着 各 种 可 能 的 情况 ， 大 量 不 同 的 实现 方案 都 
呈现 为 一 个 树 状 结构 。 因 此 ， 最 好 的 选择 是 采用 一 个 开放 的 架构 ， 对 被 模拟 的 各 个 实 
体 进行 合理 的 抽象 。 

目前 ，CDN 的 模拟 环境 不 多 ， 相 关 研 究 人 员 也 没有 一 个 可 供 参考 的 标准 路 线 图 
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(roadmap) 去 设计 和 实施 这 样 一 个 复杂 的 环境 。 这 些 困难 表明 了 开发 一 个 在 大 多 数 情 
况 下 可 用 的 和 开放 的 CDN 模拟 环境 的 必要 性 ， 本 章 的 写作 也 源 于 此 。 具 体 而 言 ， 本 
章 的 主要 贡献 是 : 

1) 为 CDN 环境 下 的 Web 缓存 问题 提供 充分 的 背景 。 

2) 对 于 一 个 支持 Web 缓存 的 CDN， 确 定 其 模拟 需求 。 

3) 对 在 一 个 实际 的 CDN 模拟 环境 中 验证 各 种 缓存 策略 的 仿真 过 程 进行 分 析 和 
建 模 。 

4) 为 那些 希望 了 解 这 个 模拟 框架 的 相关 性 能 问题 的 研究 人 员 提供 一 个 路 线 图 。 

总 之 ， 本 章 的 主要 目的 是 提供 一 套 可 靠 的 设计 方法 ， 以 及 分 享 具体 实践 过 程 中 的 
经 验 ， 同 时 涵盖 一 个 CDN 模拟 框架 中 与 Web 缓存 有 关 的 大 部 分 问题 。 

本 章 的 其 余 内 容 安排 如 下 : 首先 提出 在 Web 中 通过 CDN 和 代理 服务 器 进行 内 容 
分 发 时 的 各 种 相关 问题 ， 其 次 ， 对 集成 CDN 与 代理 服务 器 的 缓存 特性 的 可 能 性 进行 
验证 ; 随后 ， 提 供 动态 内 容 和 若干 技术 的 一 个 分 类 ; 接 下 来 ， 提 供 对 缓存 一 致 性 问题 
的 解决 方案 ; 最后， 对 如 何在 一 个 模拟 环境 中 对 提出 的 缓存 策略 进行 建 模 和 实现 进行 
深入 的 分 析 。 


5.2 Web 内容 分 发 


以 合理 的 效率 和 成 本 向 互联 网 用 户 分 发 信息 是 一 个 具有 挑战 性 的 问题 。Web 数 
据 缓 存 和 复制 技术 已 成 为 解决 这 一 问题 的 关键 ， 因 为 它们 能 够 提供 扩展 性 更 高 的 
解决 方案 。Web 缓存 主要 由 代理 服务 器 实现 ， 其 中 内 容 的 复制 是 其 主要 目标 。 
大 致 地 说 ，Web 缓存 和 内 容 复 制 的 目的 是 将 工作 负载 从 处 于 过 载 状态 的 内 容 提供 
商 那里 转移 出 去 ， 由 中 间 环 节 (CDN 服务 器 或 代理 服务 器 ) 对 用 户 的 请 求 进行 服 
务 。 互 联网 服务 提供 商 (ISP) 使 用 代理 来 存储 最 常 使 用 或 最 近 使 用 的 内 容 。 同 
Bt, Web 内 容 提供 商 可 以 与 一 个 CDN 提供 商 (Al Akamai) 签订 协议 ， 由 CDN 服务 
器 提供 其 站 点 的 内 容 。 在 下 面 各 节 中 ， 将 对 Web 中 上 述 两 个 媒介 网 络 的 主要 特性 
进行 介绍 。 


5.2.1 代理 服务 器 


代理 服务 器 由 ISP 部 署 在 互联 网 中 ， 用 来 应 对 不 断 增长 的 Web 流量 以 及 优化 Web 
上 的 内 容 分 发 。 特 别 地 ， 代 理 服务 器 充当 了 用 户 和 内 容 提 供 商 之 间 的 中 介 ， 通 过 
本 地 存储 的 内 容 对 用 户 的 请 求 进行 服务 。 用 户 与 代理 服务 器 建立 连接 ， 当 收 到 每 个 请 
求 时， 代理 服 务 器 首先 确定 被 请 求 的 对 象 在 其 本 地 是 否 存在 一 个 有 效 的 副本 。 如 果 该 
副本 存在 且 内 容 没 有 过 期 ， 则 视 为 一 次 缓存 命中 (cache hit) ， 否 则 代理 服务 器 必须 
替 用 户 将 该 请 求 转发 出 去 。 如 果 用 户 请 求 的 对 象 在 本 地 没有 满足 要 求 的 副本 ， 那 么 在 
接收 到 这 个 新 对 象 后 ， 代 理 服务 器 将 该 对 象 发 送 至 终端 用 户 ， 并 在 其 本 地 建立 一 份 
副本 。 

因此 ， 对 象 在 中 间 节 点 上 的 缓存 降低 了 带宽 消耗 、 网 络 拥堵 和 网 络 流量 。 同 时 ， 
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由 于 被 缓存 的 对 象 由 代理 服务 器 分 发 ， 因 而 减少 了 外 部 延 时 (将 对 象 从 源 服务 器 传 
输 到 代理 服务 器 的 时 间 ) 。 最 后 ， 代 理 服 务 器 缓存 提高 了 容错 能 力 ， 因 为 即使 在 远程 
服务 器 不 可 用 或 无 法 访问 时 用 户 也 可 以 获得 被 缓存 内 容 的 一 个 副本 。 

另外 ， 使 用 共享 的 代理 缓存 有 三 个 明显 的 缺陷 : 首先 ， 如 果 缓 存 中 的 副本 没有 正 
确 更 新 ， 用 户 可 能 会 收 到 过 期 的 数据 ， 而 且 随 着 用 户 数 的 增加 ， 内 容 提供 商 一 般 会 成 
为 瓶颈 ; 其 次 ， 缓 存在 瞬时 拥塞 时 不 能 提高 可 用 性 ; 第 三 ， 缓 存 服务 器 的 系统 资源 
(内 存 空 间 、 磁 盘 容 量 、LO 带宽 、 处 理 能 力 和 联网 资源 ) 是 有 限 的 。 

产生 上 述 问题 的 原因 在 于 ， 代 理 服务 器 一 直 以 来 是 被 设计 用 于 局 部 性 的 工作 。 当 
代理 服务 器 不 能 满足 用 户 请 求 时 ， 应 该 从 Web 内 容 提 供 商 处 获取 内 容 。 然 而 ， 这 可 
能 会 导致 拒绝 服务 (DoS), ALA Web 内 容 提供 商 不 能 应 对 庞大 数量 的 请 求 (每 个 
Web 内 容 提 供 商 提供 的 HTTP 连接 数 是 有 限 的 )。 此 外 ，Web 内 容 提供 商 和 代理 服务 
器 之 间 的 通信 可 能 会 导致 延 时 的 增加 。 例 如 ， 假 设 一 位 来 自 澳 大 利 亚 的 用 户 请 求 一 个 
网 页 ， 其 Web 内 容 提供 商 位 于 美国 ， 在 这 种 情况 下 会 建立 大 量 的 TCP 连接 ， 以 实现 
内 容 提供 商 和 代理 服务 器 之 间 的 通信 。 


5.2.2 内 容 分 发 网 


图 5. 1 显示 的 是 如 何在 Web 上 通过 代理 服务 器 和 CDN 进行 内 容 的 分 发 。 当 缓存 
没有 命中 时 ， 代 理 服务 器 与 CDN 通信 以 得 到 被 请 求 的 内 容 。 具 体 地 说 ，CDN 提供 持 
有 Web 服务 器 副本 的 多 个 接 人 点 〈 称 为 代理 缓存 服务 器 ) ， 其 中 存储 着 相同 内 容 的 副 
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第 5 章 CDN 模拟 框架 的 缓存 技术 103 





本 。CDN 根据 用 户 和 被 请 求 内 容 的 相关 信息 ， 将 用 户 的 请 求 “ 路 由 ”到 最 合适 的 站 
Mo CDN 的 用 户 是 那些 希望 将 其 内 容 分 发 给 在 地 理 上 广泛 分 布 的 大 量 终端 用 户 的 组 
织 。CDN 在 全 球 分 布 的 基础 上 通过 多 个 网 络 提供 商 ， 将 其 代理 缓存 服务 器 并 行 部 署 
在 若干 战略 数据 中 心 内 。 表 5. 1 总 结 了 代理 服务 器 和 CDN 之 间 的 主要 区 别 。 本 书 第 2 
章 有 一 个 CDN 的 全 面 分 类 ， 涉 及 组 织 结构 、 内 容 分 发 机 制 、 Pe RAE 
测量 方法 。 

5.1 代理 服务 器 与 CDN 的 比较 


特性 代理 服务 器 CDN 
关键 技术 内 容 复制 
由 受到 CDN 支持 的 内 容 提供 
被 缓存 的 内 容 态 ISP 
内 容 动态 变化 ; 由 ISP 的 用 户 请 求 X [eet | 
可 扩展 性 
性 能 难以 应 对 瞬时 拥塞 稳定 ; ART XE UR ULIS B3 V. FH 


(如 流 媒 体 ) 


5.3 CDN 中 新 兴 的 Web 数据 缓存 技术 


CDN 管理 着 分 布 式 全 局 信息 资源 ， 这 些 资源 涉及 一 系列 的 应 用 。 用 户 与 公司 、 
组 织 、 政 府 机 构 、 教 育 或 协作 环境 之 间 (或 在 其 内 部 ) 进行 交互 。CDN 之 所 以 受到 
青睐 ， 是 由 于 它 能 够 在 全 球 范围 内 有 效 地 分 发 动态 、 分 布 式 、 异 构 和 非 结构 化 数据 。 
因此 ， 为 了 改善 信息 在 互联 网 上 的 分 发 ， 必 须 为 CDN 开发 各 种 Web 数据 缓存 技术 和 
机 制 。 


5.3.1 CDN 缓存 


正如 前 面 提 到 的 ，Web 缓存 和 内 容 复 制 已 发 展 为 两 大 类 方法 ， 以 满足 用 户 不 断 
增加 的 需求 。 

1. Web 缓存 方法 

代理 服务 器 将 Web 对 象 存储 到 自己 的 缓存 。 不 过 ， 缓 存 哪 些 对 象 由 一 个 缓存 置 
换 策 略 确定 。 缓 存 置换 策略 决定 哪些 对 象 会 从 缓存 中 移出 ， 以 给 新 的 对 象 提供 存储 位 
置 。 在 这 种 策略 下 ， 每 个 对 象 由 一 个 “ 值 ”来 表征 ， 即 所 谓 的 缓存 效用 值 ( Cache U- 
tility Value, CUV) , CUV 值 最 小 的 对 象 在 需要 时 将 被 首先 清除 出 缓存 。 Podlipnig 等 人 
在 参考 文献 [23] 中 对 现 有 的 缓存 置换 策略 进行 了 深入 的 总 结 。 

2. 内 容 复制 方法 

代理 缓存 服务 器 为 内 容 提供 商 保存 Web 对 象 的 副本 。 与 代理 服务 器 相反 ， CDN 
中 复制 的 内 容 一 直 保 持 静 态 不 变 。 

然而 ，CDN 的 内 容 复 制 方法 具有 固有 的 局 限 性 ， 主 要 是 CDN 设施 不 能 对 复制 的 
内 容 提供 有 效 的 管理 。 另 外 ， 副 本 置换 在 大 多 数 时 间 内 是 静态 的 。 内 容 的 静态 性 导致 


104 内 容 分 发 网 络 


了 存储 空间 使 用 的 低 效 ， 因 为 经 过 一 段 时 间 后 代理 缓存 服务 器 的 缓存 中 存放 的 很 可 能 
是 没 用 的 对 象 。 因 此 ， 如 果 用 户 访 问 模式 发 生 改 变 ， 那么 代理 缓存 服务 器 中 存放 的 副 
本 将 不 能 满足 用 户 的 要 求 。 

为 了 解决 上 述 问题 ,一 个 办 法 是 将 缓存 和 复制 这 两 种 策略 整合 到 代理 缓存 服务 器 
的 存储 空间 上 。Stamos 等 人 "的 实验 结果 表明 ， 一 个 综合 的 策略 优 于 单独 使 用 缓存 
或 静态 复制 策略 。 

下 面 给 出 综合 策略 的 规范 定义 。 假 设 一 个 网 站 W 5; CDN 提供 商 签订 协议 。 网 站 用 
个 对 象 ， 起 初 只 位 于 内 容 提供 商 处 (CDN 外 面 ) ， 则 WW 的 总 大 小 W^ 由 式 (5.1) 给 出 。 


N 
w= SU (5.1) 
k=] 


式 中 ，U 是 第 个 对 象 的 大 小 (1& EN), 

ix CDN 的 代理 缓存 服务 器 有 M 个。 每 个 代理 缓存 服务 器 M, 的 缓存 总 容量 为 
Mi(1<i<M)， 用 于 复制 下 的 内 容 ， 而 内 容 原 件 位 于 内 容 提供 商 处 。 为 简单 起 见 ， 
假设 每 个 代理 缓存 服务 器 的 缓存 容量 相同 ， 均 为 M^ 且 不 包含 其 他 Web 站 点 的 内 容 。 

如 图 5. 2 所 示 ， 代 理 缓存 服务 器 可 以 划分 为 两 个 分 区 。 

1. 静态 缓存 分 区 

”该 缓存 分 区 用 于 静态 内 容 的 复制 ， 其 大 小 定义 为 M 的 一 个 百分比 r(re [0， 
1] ) 。 因 此 ， 位 于 代理 缓存 服务 器 静态 缓存 中 的 被 复制 对 象 服 从 约束 条 件 (5.2). 


缓存 置换 策略 
(LRU, LFU...) 


复制 
(il2p,GG...) 


r% 





图 5.2 CDN 的 集成 缓存 


2: (f,U,) < rM? (5.2) 
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AP, ARRIR k 是 否 存在 于 代理 缓存 服务 器 i RAE, BIS, = 1 表示 第 大 个 对 象 
在 第 ; 个 代理 服务 器 ， 否 则 户 = 0。 基态 缓 存 中 的 内 容 取决 于 所 采用 的 内 容 复制 算法 。 
BAK [12, 19, 21, 32, 37] 中 给 出 了 各 种 内 容 复制 算法 。Kangasharju 4& A U^! 
使 用 四 种 启发 式 方法 : 随机 、 受 欢迎 度 、 贪 心 、 全 局 贪心 。 实 验 结果 表明 ， 全 局 贪心 
算法 胜 过 所 有 其 他 办 法 。 然 而 ,贪心 算法 的 高 复杂 性 使 其 在 实际 应 用 中 不 具备 可 行 
性 。Tse5 ”从 另 一 个 角度 研究 了 内 容 置 换 的 问题 ， 提 出 了 一 系列 的 贪心 算法 ， 在 对 代 
理 缓存 服务 器 的 负载 和 大 小 进行 均衡 的 时 候 执行 置换 操作 。Zhuo 等 人 也 提出 了 一 个 
非常 类 似 的 方法 ” 。Pallis EA 提出 了 一 种 自 调节 、 与 参数 无 关 的 算法 〈 称 为 Lat 
-cdn) ， 该 算法 基于 网 络 延 时 来 置换 CDN 代理 缓存 服务 器 中 的 对 象 。 在 参考 文献 
[19] F, Palis 等 人 将 内 容 置换 问题 划分 为 两 个 子 问题 : 一 是 定义 延 时 最 小 的 “对 
象 一 代理 缓存 服务 器 ”对 ， 二 是 根据 用 户 的 工作 负载 决定 复制 哪些 对 象 ， 这 种 方法 
被 称 为 il2p。 

2. 动态 缓存 分 区 

该 分 区 由 使 用 缓存 置换 策略 的 Web 缓存 支配 。 为 了 规范 地 定义 动态 缓存 分 区 ， 
动态 缓存 的 大 小 定义 为 M 的 一 个 百分比 (ce [0, 1] ) 。 具 体 地 说 ， 被 存储 对 象 的 存 
储 容量 服从 约束 条 件 (5.3) 。 


IA (faU) < cM? (5.3) 


初始 情况 下 动态 缓存 为 空 ， 这 是 因为 其 存储 的 内 容 是 在 运行 期 间 根据 所 选 的 缓存 
置换 策略 填 人 的 。 代 理 缓存 服务 器 的 动态 缓存 分 区 内 存储 的 是 CUV 值 最 高 的 那些 副 
本 。 除 了 传统 的 置换 策略 (WLRU, LFU), Aioffi 等 人 “使 用 在 线 启发 式 算法 决定 是 
和 否 加 入 新 的 内 容 副本 或 删除 现 有 的 副本 。 该 算法 (PRATER, MDCDN) 是 一 种 基于 统 
计 预 测 的 方法 ， 称 为 双 指 数 平滑 (DES) 。 考 虑 到 用 户 需 求 的 变化 ，MDCDN 预测 未 来 
对 每 个 代理 缓存 服务 器 的 需求 ， 以 此 确定 被 缓存 对 象 的 CUV 值 。 在 Chen 等 人 "提出 
的 方法 中 ， 使 用 一 个 应 用 级 组 播 树 作为 每 个 代理 缓存 服务 的 缓存 置换 策略 。Presti 等 
人 上 鸣 使 用 一 个 非 线 性 整数 规划 方法 确定 副本 的 CUV 值 。Bartolini 等 人 ”采用 一 个 半 
马尔 科 夫 决策 过 程 决 定 增加 一 个 新 的 副本 还 是 删除 一 个 现 有 的 副本 。 
根据 上 述 的 缓存 分 割 策略 ， 百 分 比 (r, c) 需 服从 式 (5.4). 
r+c=1l (5.4) 
这 种 方法 面临 的 挑战 ， 是 如 何 确定 代理 缓存 服务 器 用 于 缓存 和 复制 的 空间 大 小 ， 
即 确定 百分比 〈r，e) 。 考 虑 到 这 是 一 个 NP 完全 问题 ， 一 些 启发 式 方法 可 以 有 效 地 
整合 代理 缓存 服务 器 的 静态 和 动态 缓存 。Bakiras 等 人 中 提出 的 一 个 贪心 混合 算法 将 
一 个 LRU 缓存 置换 策略 与 静态 内 容 复 制 结 合 起 来 。 具 体 地 说 ， 最 初 每 个 代理 缓存 服 
务 器 的 存储 容量 保留 给 Web 缓存 使 用 ， 在 每 一 步 先 代 中 对 象 根据 收益 值 最 大 化 的 原 
则 被 放置 到 一 个 代理 缓存 服务 器 。 在 决定 是 否 将 一 个 静态 内 容 放置 在 代理 缓存 服务 器 
时 ， 需 要 判断 这 样 做 是 否 可 以 使 响应 时 间 最 优 。 根 据 这 个 判断 条 件 ， 混 合算 法 逐步 将 
静态 内 容 填 人 代理 缓存 服务 器 的 缓存 。Stamos 4 A 提出 了 一 个 置换 相似 性 方法 
(SRC) ， 用 来 评价 Web 缓存 与 内 容 复制 的 综合 水 平 。 该 办 法 使 用 一 个 相似 性 测度 来 
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确定 代理 缓存 服务 器 实现 缓存 和 复制 所 需 的 容量 大 小 。Pallis 等 人 ”使 用 logistic sig- 
moid 函数 将 代理 服务 器 的 缓存 分 为 两 部 分 ， 在 他 们 的 方法 (PR RP) 中 根据 质量 值 
对 副本 进行 分 类 ， 该 指标 值 表示 用 户 对 这 个 副本 的 兴趣 ， 如 果 有 兴趣 则 该 值 增 大 ， 反 
之 减少 。 


5.3.2. 动态 内 容 的 缓存 


根据 Web 对 象 发 生变 化 的 频 度 及 可 预测 性 ， 动 态 内 容 可 分 为 三 类 ， 如 图 5.3 所 
示 。 内 容 提供 商 每 隔 特定 时 间 进 行 一 次 更 新 的 对 象 属于 “定期 更 新 ”类 ， 如 一 个 每 
Smin 更 新 一 次 的 新 闻 网 页 。 第 二 种 是 “ 按 需 更 新 ”类 ， 该 类 中 的 对 象 在 需要 的 时 候 
创建 ， 且 随 用 户 的 不 同 可 能 会 有 不 同 的 属性 〈 如 查询 表 ) 。 最 后 一 种 是 “更 新 不 可 预 
测 ” 类 ， 指 那些 无 法 预测 其 变化 的 对 象 。 定 期 更 新 和 更 新 不 可 预测 这 两 类 对 象 可 以 


被 缓存 ， 而 按 需 更 新 的 对 象 是 不 可 缓存 的 。 


改变 是 可 预测 的 吗 ? 





较 少 地 频繁 地 持续 地 
改变 频率 


图 5.3 动态 内 容 的 分 类 


由 于 Web 中 的 动态 数据 越 来 越 多 ， 如 何 高 效 地 将 动态 内 容 分 发 到 终端 用 户 是 一 
个 重要 的 问题 。 研 究 人 员 提 出 了 各 种 缓存 技术 以 加 速 动态 内 容 的 分 发 "“” 。 当 前 Web 
应 用 通常 会 产生 具有 复杂 布局 的 异 构 内 容 ， 所 以 基于 片段 的 缓存 是 一 种 加 速 Web 应 
用 的 有 效 技术 。 

一 个 片段 可 以 被 定义 为 网 页 的 一 部 分 ， 具 有 区 别 于 页 面 其 他 部 分 的 特定 主题 或 功 
能 ， 被 独立 地 存储 在 内 容 提 供 商 或 代理 缓存 服务 器 上 。Challenger 等 人 “使 用 对 象 依 
赖 图 表示 页 面 与 片段 之 间 的 关系 。 

基于 片段 的 方法 已 被 一 些 商业 CDN 提供 商 采 用 。 例 如 ，Akamai 的 EdgeSuite 网 络 
采用 了 一 个 基于 片段 的 策略 ， 其 中 使 用 了 被 WWW 业界 认可 的 EST 规范 。 具 体 地 说 ， 
ESI 规范 定义 了 一 种 基于 XML 的 标记 语言 ， 用 于 定义 模板 和 识别 页 面 中 的 片段 。IBM 
的 Websphere ”也 使 用 了 一 个 基于 片段 的 策略 ， 其 中 页 面 被 分 解 为 一 个 由 若干 复杂 、 
原子 级 片段 构成 的 金字 塔 结构 。 
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基于 片段 的 方法 不 能 有 效 地 应 用 于 “ 按 需 更 新 ”类 对 象 ， 因 为 这 些 对 象 不 能 被 
缓存 。 基 于 片段 的 方法 适用 于 请 求 的 时 间 局 部 性 较 高 且 数 据 库 更 新 很 少 的 情况 ， 如 果 
没有 这 种 行为 特性 ， 那 么 就 需要 采用 更 复杂 的 技术 ” 。 因 此 ， 一 种 方法 是 在 代理 组 
存 服务 器 上 复制 整个 应 用 代码 的 副本 ， 每 个 代理 缓存 服务 器 可 能 连接 到 一 个 中 央 
数据 库 ， 将 所 有 对 数据 库 的 操作 请 求 转发 给 内 容 提供 商 。 虽 然 这 种 技术 人 允许 通过 分 布 
式 计算 的 方式 生成 网 页 ， 但 会 受到 每 个 查询 的 延 时 及 源 数据 库 吞 吐 量 瓶颈 的 限制 *。 
为 了 解决 这 个 问题 ， 另 一 种 方法 是 保存 数据 库 的 部 分 副本 〈 称 为 内 容 已 知 缓存 方 
法 ) ， 编 程 人 员 在 开发 一 个 应 用 时 可 以 复制 最 适 于 这 个 应 用 的 数据 。 只 要 选 定 的 策略 
与 该 应 用 相 适 应 ， 该 方法 就 可 以 显著 地 提高 性 能 和 可 用 性 ”) 。 然 而 ， 这 在 具体 实现 
时 是 相当 困难 的 ， 因 为 它 要 求 应 用 的 开发 人 员 在 容错 性 和 缓存 弱 一 致 性 等 方面 具有 很 
深入 的 理解 。 在 这 种 情况 下 ， 可 以 使 用 另 一 种 技术 〈 称 为 内 容 未 知 缓存 ) ， 用 来 在 代 
理 缓 存 服务 器 中 对 数据 库 操 作 的 结果 进行 缓存 。 当 数据 库 发 生 更 新 时 ， 必 须 维 持 被 组 
存 结果 的 一 致 性 。 因 为 许多 对 数据 库 的 请 求 可 以 在 本 地 做 出 响应 ， 所 以 这 种 技术 可 以 
减少 数据 库 操作 结果 的 传输 延 时 ; 而 由 于 转发 给 内 容 提 供 商 的 请 求 变 得 更 少 了 ， 因 此 
整个 系统 的 总 吞吐 量 也 有 所 增 大 。 


5.3.3 缓存 的 一 致 性 机 制 


考虑 到 Web 内 容 的 动态 性 ， 维 护 内 容 的 一 致 性 成 为 必须 解决 的 一 个 重要 问题 。 
为 了 防止 失效 的 内 容 传 输 给 最 终 用 户 ， 代 理 缓存 服务 器 必须 确保 本 地 的 缓存 数据 与 存储 
在 服务 器 上 的 数据 是 一 致 的 。CDN 使 用 哪 种 一 致 性 机 制 以 及 实现 到 什么 程度 ， 取 决 于 
被 缓存 数据 的 特性 。 因 此 ，CDN 应 该 采用 合适 的 机 制 确保 其 副本 与 内 容 提 供 商 一 致 。 

代理 服务 器 的 一 致 性 维护 问题 已 得 到 了 大 量 的 研究 。 例 如 ， 代 理 服务 器 中 广泛 使 
用 的 TIL 技术 中 ， 在 向 代理 服务 器 提供 一 个 可 缓存 对 象 时 ， 内 容 提供 商 提 供 一 个 
TTL 值 ， 由 代理 服务 器 判断 该 对 象 在 其 生存 期 内 是 否 有 效 。 在 CDN rp, TTL 的 概念 
可 以 用 于 每 个 代理 缓存 服务 器 ， 每 个 服务 器 负责 维持 其 缓存 数据 的 一 致 性 。 因 此 ， 每 
一 个 代理 缓存 服务 器 独立 地 与 内 容 提 供 商 进行 交互 ， 而 与 其 他 的 服务 器 无 关 。 然 而 ， 
从 内 容 提供 商 的 角度 来 看 ， 这 种 做 法 在 一 个 大 型 网 络 中 可 能 不 具有 可 操作 性 。 例 如 ， 
一 个 典型 的 CDN、 通 常 由 大 量 代理 缓存 服务 器 组 成 (如 Akamai 公司 ， 这 是 一 个 处 于 
主导 地 位 的 CDN 提供 商 ， 在 全 世界 拥有 超过 25 000 台 代 理 缓存 服务 器 ) ， 内 容 提供 
商 需 要 单独 与 大 量 的 代理 缓存 服务 器 进行 交互 。 

为 了 规范 地 定义 一 致 性 的 实现 程度 ， 令 CP 和 S. 分 别 表示 1 时刻 对 象 上 在 内 容 提 
供 商 和 代理 缓存 服务 器 处 的 版 本 ， 这 时 一 个 对 象 的 一 致 性 可 以 有 以 下 几 种 实现 
级 别 : 

1) 与 内 容 提供 商 处 的 版 本 保持 强 一 致 (strongly consistent) 。 对 象 & 在 代理 服务 
器 上 的 版 本 始终 与 内 容 提 供 商 的 最 新 版 本 一 致 ， 即 对 于 任意 的 +:，CP; = 5;。 强 一 致 性 
忽略 了 数据 更 新 的 信息 传 到 代理 缓存 服务 器 过 程 中 引信 的 网 络 延 时 。 

2) 与 内 容 提供 商 处 的 版 本 保持 A 一 致 ( delta consistent) 。 当 内 容 提 供 商 修改 对 
象 内 容 后 ， 需 在 4 个 时 间 单 位 内 对 代理 缓存 服务 器 上 的 版 本 进行 更 新 ， 其 中 4 是 一 
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个 可 配置 的 参数 ， 即 对 于 任意 1t， 存 在 + (0<r<4A) ， 有 CPL" =S 

3) 与 内 容 提 供 商 处 的 版 本 保持 弱 一 致 (weak consistent)。 代 理 缓存 服务 器 上 的 
版 本 并 不 总 是 与 内 容 提 供 商 保持 一 致 。 

一 致 性 程度 也 可 以 对 多 对 象 进行 定义 ， 称 为 相互 一 致 性 。 为 了 规范 地 定义 这 个 一 
致 性 程度 ， 考 虑 两 个 相互 关联 的 对 象 a 和 4b。 对 于 对 象 a 和 4， 在 时 间 i 的 缓存 版 本 
(分 别 为 S; AS), 定义 二 者 在 时 域 上 相互 一 致 (M, 一 致 ) 的 条 件 为 : 若 CP' = Ss 和 
CP, = S; 则 1 t -i1 <6， 其 中 6 是 对 一 致 性 偏差 的 容忍 度 ，6 =0 表示 在 过 去 的 某 些 
时 刻 两 个 对 象 同 时 存在 于 内 容 提供 商 。 

目前 ， 存 在 着 各 种 机 制 可 以 提供 高 效 的 缓存 一 致 性 “””。 这 些 机 制 可 以 大 致 
分 为 以 下 几 类 : 

1) 服务 器 驱动 的 一 致 性 〈 也 称 为 基于 服务 器 的 失效 性 ) 。 一 旦 内 容 发 生变 化 ， 
内 容 提 供 商 就 通知 代理 缓存 服务 器 。 因 为 只 有 当 对 象 被 修改 时 信息 才 发 送 ， 所 以 这 种 
方法 大 大 降低 了 内 容 提供 商 和 代理 缓存 服务 器 之 间 控 制 信息 的 数量 。 然 而 ， 这 会 降低 
内 容 分 发 时 分 布 式 网 络 的 使 用 效率 ， 也 降低 了 代理 缓存 服务 器 一 致 性 管理 的 效率 ， 因 
为 这 时 内 容 提 供 商 就 需要 为 所 有 持 有 对 象 的 代理 缓存 服务 器 维护 一 个 表 。 最 近 出 现 的 
几 个 新 协议 使 用 基于 服务 器 的 失效 性 来 提供 一 致 性 机 制 。Web 缓存 失效 协议 
(WCIP)5 使 用 应 用 级 组 播 来 发 送 服务 器 的 失效 性 信息 。Web 内 容 分 发 协议 
(WCDP) 5 是 另 一 种 支持 一 致 性 的 方法 ， 内 容 提 供 商 使 用 该 方法 可 以 动态 控制 对 象 
更 新 信息 的 传播 和 可 视 性 ，WCDP 能 够 支持 不 同 级 别 的 一 致 性 ( 即 强 一 致 性 、A 一 致 
性 、 弱 一 致 性 和 相互 一 致 性 ) 。 

2) 客户 端 驱动 的 一 致 性 (也 称 为 客户 端 轮 询 )。 内 容 提 供 商 的 对 象 无 论 什么 时 
候 发 生变 化 ， 其 最 新 版 本 都 会 随时 传递 给 所 有 的 代理 缓存 服务 器 ， 其 优势 是 内 容 提 供 
商 不 需要 维护 任何 列表 。 然 而 ， 如 果 对 象 被 更 新 的 频率 大 于 被 访问 的 频率 ,那么 这 种 
做 法 可 能 会 产生 大 量 不 必要 的 流量 。Mikhailov 和 Wills ^ 提出 了 一 个 称 为 MONARCH 
(用 装配 、 关 联 和 变化 特性 来 管理 网 络 对 象 ) 的 方法 ， 可 以 通过 从 感 兴趣 的 网 站 上 收 
集 内 容 的 快照 来 保证 缓存 的 一 致 性 。 这 些 内 容 被 输入 到 一 个 仿真 器 中 ， 对 一 系列 访问 
模式 下 的 缓存 一 致 性 进行 评估 。 

3) 租 期 方法 。 该 方法 给 每 个 对 象 赋予 一 个 租 期 。 租 期 是 一 个 时 间 段 ， 其 长 度 
表示 当 对 象 发 生 修改 时 内 容 提 供 商 在 该 时 间 段 内 同意 通知 代理 缓存 服务 器 。 租 期 
期 满 时 ， 代 理 缓存 服务 器 必须 发 出 一 个 信息 ， 要 求 续 订 租 期 。 这 种 方法 是 服务 器 
驱动 和 客户 端 驱动 两 种 一 致 性 方法 的 结合 。 如 果 租 期 是 0， 则 退化 为 纯 客 户 端 驱动 
的 方式 ; 而 如 果 租 期 为 无 穷 大 ， 则 退化 为 纯 服 务 器 驱动 的 方式 。 租 期 的 概念 首次 
用 于 解决 缓存 一 致 性 问题 是 在 分 布 式 文件 系统 中 ""， 而 首次 在 Web 代理 缓存 上 的 
应 用 则 出 现在 参考 文献 [15] 中 。Duvvuri 45 A xf HTTP 进行 了 扩展 ， 使 之 包含 
租 期 的 概念 。Ninan AU 针对 CDN 提出 了 租 期 方法 的 一 个 变种 ， 称 为 协作 租 期 ， 
其 中 使 用 了 4 一致 性 的 思想 ， 也 就 是 说 ， 要 求 一 个 对 象 的 缓存 版 本 相对 于 它 的 服 
务 器 版 本 在 4 的 时 间 单 位 内 是 有 效 的 ，A 值 决定 了 这 个 担保 的 强度 ， 越 大 则 一 致 性 
就 越 弱 。 
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5.4 CDNsim 的 缓存 技术 


本 节 使 用 一 个 实际 的 CDN 模拟 器 来 介绍 缓存 置换 策略 ， 其 中 将 CDNsime 作 为 主 
要 模型 。 首 先 ， 介 绍 这 种 模拟 环境 的 必要 性 以 及 其 他 一 些 模 拟 方法 ; 其 次 ， 从 科学 问 
题 和 资源 需求 的 角度 定义 一 个 被 模拟 缓存 的 需求 ; 最 后 ， 就 这 种 缓存 框架 在 实际 开发 
时 的 一 些 相关 问题 进行 讨论 。 


5.4.1 CDN 模拟 环境 的 需要 


目前 ， 存 在 一 些 私 有 和 学 术 性 质 的 CDN 用 于 研究 和 日 常 应 用 ， 如 CoDeeN 、 
Coral? 和 Globule? 。 但 是 ， 由 于 现在 面临 的 是 实际 网 络 ， 所 以 实验 不 可 能 重 现 。 而 
且 ， 新 策略 的 执行 和 评估 也 很 难 ， 因 为 这 需要 对 整个 系统 进行 大 规模 的 改造 。 因 此 ， 
为 了 进行 实验 有 必要 进行 模拟 环境 的 搭建 。 在 这 个 方向 上 ， 已 经 有 了 一 些 模拟 CDN 
的 具体 实现 ”…”” ， 可 以 满足 单个 研究 工作 的 需求 。 但 是 ， 这 些 模拟 CDN 大 多 没有 
考虑 到 几 个 关键 因素 ， 如 网 络 中 可 能 出 现 的 瓶颈 以 及 每 个 网 络 资源 (如 路 由 器 、 代 
理 服务 器 ) 提供 的 会 话 数 量 ， 而 且 它 们 也 未 考虑 到 TCP/IP。 除 此 之 外 ， 这 些 模 拟 环 
境 最 大 的 缺点 是 没有 用 于 验证 CDN 缓存 技术 的 平台 。 

CDNsim 填补 了 这 一 空白 ， 它 被 开发 为 一 个 通用 的 CDN 模拟 器 。CDNsim 用 C + + 
编写 ,可 扩展 且 源 码 开放 ,使 用 OMNET + + 和 INET 库 。 它 是 一 个 并 行 离散 事件 跟踪 
驱动 网 络 模 拟 包 ， 提 供 库 、 例 程 及 网 页 内 容 分 发 的 接口 。CDNsim 对 一 个 CDN 进行 了 建 
Ei, 该 CDN 包括 了 基本 的 网 络 要 素 ， 如 用 户 、 代 理 缓 存 服务 器 、 内 容 提供 商 和 路 由 器 。 
通过 对 TCP/IP 的 模拟 ， 该 模型 考虑 到 了 互联 网 设施 的 特性 。CDNsim 的 设计 支持 对 大 范 
围 内 CDN 服务 的 研究 ， 它 还 能 够 模拟 P2P 网 络 服务 以 及 各 种 网 际 互 连 的 配置 。 下 面 将 
介绍 这 个 模拟 器 的 特点 。 


5.4.2 CDNsim 的 缓存 框架 的 要 求 


这 里 介绍 CDNsim 中 代理 缓存 服务 器 的 缓存 规范 (设计 时 考虑 ) 以 及 解决 研究 和 性 
能 等 方面 的 相关 问题 。 对 缓存 设计 的 一 个 要 求 是 要 支持 参考 文献 [2, 20, 29, 30] 中 
的 综合 缓存 方法 ， 同 时 也 必须 能 够 支持 缓存 一 致 性 机 制 。 此 外 ， 它 需要 支持 视频 等 复杂 
的 内 容 类 型 以 及 基于 片段 的 动态 内 容 的 处 理 。 最 后 ， 它 还 应 该 支持 不 可 缓存 的 内 容 。 

缓存 置换 算法 的 多 样 性 导致 了 实现 时 大 量 的 执行 分 支 ， 例 如 LFU 和 SIZE 利用 对 象 的 
不 同属 性 进行 对 象 的 置换 。 因 此 ， 有 必要 从 各 种 情况 中 提取 出 公共 的 交集 。 更 具体 地 说 ， 
给 定 一 组 基本 的 通用 操作 和 内 容 类 型 ， 就 应 该 能 够 实现 上 述 任何 一 种 方法 。 所 以 ， 必 须 定 
义 一 个 严格 的 需求 分 析 ， 作 为 编写 、 实 现 各 种 缓存 方法 的 一 组 接口 。 另 外 ， 需 要 考虑 缓存 
内 容 如 何在 网 络 上 适当 地 发 布 ， 以 允许 用 户 和 CDN 分 别 实现 内 容 的 下 载 和 管理 。 


© http: //oswinds. esd. auth. gr/ ~ cdnsim。 一 一 原 书 注 
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一 个 CDN 模拟 器 的 执行 需要 代理 服务 器 的 缓存 具有 高 活动 性 。 一 个 典型 的 模拟 
场景 中 存在 若干 用 户 ， 他 们 向 CDN 发 送 申请 对 象 (网 页 、 多 媒体 内 容 等 ) 的 请 求 。 
代理 缓存 服务 器 管理 其 缓存 的 内 容 ， 并 试图 对 这 些 请 求 进行 服务 。 通 过 增加 请 求 的 数 
量 ， 所 需 的 (主机 运行 模拟 操作 的 ) CPU 时 间 也 随 之 增加 。 此 外 ， 缓 存 容 量 的 增加 
会 导致 更 多 的 对 象 被 存储 ， 并 对 内 存 提 出 更 高 的 要 求 。 显 然 ， 各 种 模拟 场景 和 配置 的 
不 同 ， 使 缓存 有 可 能 成 为 性 能 的 瓶颈 。 

对 性 能 来 说 ， 我 们 关注 的 主要 是 在 CPU 需求 的 角度 上 优化 缓存 的 功能 。 为 了 确 
定 一 个 合适 的 性 能 装 值 ， 缓 存 的 操作 应 包括 : 

1) 搜索 (Search) 。 该 操作 在 被 缓存 内 容 中 寻找 指定 的 对 象 。 例 如 ， 一 个 用 户 请 
求 一 个 网 页 ， 代 理 缓 存 服务 器 检查 缓存 中 是 否 存储 了 该 内 容 。 这 种 操作 的 性 能 好 坏 取 
决 于 对 内 容 的 组 织 。 在 一 般 情 况 下 搜索 的 复杂 性 应 该 总 是 优 于 O(n), KP n dédit 
储 在 缓存 中 的 对 象 数 。 这 一 点 至 关 重 要 ， 因 为 在 模拟 过 程 中 搜索 操作 可 能 执行 数 百 万 
次 ， 而 缓存 中 可 能 有 数 千 个 对 象 。 

2) JA (Insertion) 。 该 操作 在 缓存 中 插 人 一 个 新 的 对 象 ， 它 负责 组 织 好 缓存 以 
及 更 新 其 他 的 属性 ， 如 剩余 存储 空间 。 同 样 ， 它 必须 具有 高 于 O(n) 的 效率 。 每 一 个 
置换 策略 都 包含 插入 操作 。 一 次 模拟 的 过 程 将 可 能 执行 很 多 次 ， 所 以 这 是 一 个 至 关 重 
要 的 优化 参数 。 

3) 删除 (Deletion) 。 该 操作 从 缓存 中 删除 一 个 特定 的 对 象 。 每 个 缓存 置换 算法 
将 待 删除 对 象 移 除 以 释放 存储 空间 ， 因 此 其 性 能 的 下 限 是 0(n)。 

4) 更 新 〈Update) 。 更 新 是 将 对 象 的 前 一 个 版 本 删除 并 将 更 新 后 的 版 本 插 和 人 。 当 
采用 缓存 一 致 性 机 制 时 ， 会 用 到 更 新 操作 。 

从 文中 可 以 看 出 ， 缓 存 的 速度 与 内 容 在 主机 内 存 中 的 组 织 密切 相关 。 缓 存 的 置换 
算法 大 多 包括 搜索 、 插 入 、 删 除 、 更 新 (SIDU) 等 操作 ， 因 此 ， 优 化 的 目标 就 是 高 
效 的 内 容 管理 设计 。 

男 一 个 被 关注 的 次 要 性 能 是 内 存 的 优化 。 这 一 点 很 重要 ， 因 为 模拟 的 执行 环境 需 
要 合适 的 内 存 。 因 为 读 写 速度 的 要 求 ， 内 存 中 的 数据 绝对 不 能 被 交换 到 主机 的 硬盘 
上 ， 执 行 性 能 也 决 不 能 降低 。 因 此 ， 需 要 采取 保守 的 设计 来 节省 内 存 。 模 拟 一 个 包含 
大 量 代理 缓存 服务 器 、 缓 存 和 对 象 的 大 型 网 络 ， 所 需 的 内 存量 数 以 千 兆 字 节 。 不 过 ， 
内 存 优 化 并 不 是 很 严重 的 问题 ， 因 为 内 存 容量 的 限制 可 以 很 容易 地 通过 配备 足够 的 内 
存 来 解决 。 


5.4.3 CDNsim 的 缓存 架构 


为 了 满足 上 述 要 求 ， 本 节 定 义 了 一 个 架构 来 实现 CDNsim。 同 时 ， 对 CDN 中 的 所 
有 实体 进行 抽象 ， 将 CDN 缓存 的 组 织 结构 建 模 为 一 个 三 层 架构 ， 如 图 5.4 所 示 。 

第 一 层 负 责 处 理 内容 的 概念 问题 ， 忽 略 了 各 种 内 容 的 特性 。 一 般 情 况 下 ， 可 缓存 
的 内 容 被 认为 是 原始 的 片段 ， 如 存储 在 缓存 中 的 对 象 。 保 存 对 象 的 缓存 只 是 一 个 存储 
的 介质 ， 保 存 着 可 用 容量 等 最 新 的 信息 ， 并 提供 前 面 所 述 的 SIDU 接口 。 对 象 可 分 为 
两 类 : 非 易 变 的 和 易 变 (volatile) 的 对 象 ， 前 者 指 存储 在 缓存 中 的 静态 对 象 ， 而 后 者 
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是 可 以 通过 缓存 置换 算法 移出 缓存 的 对 象 。 通 过 标记 对 象 的 方式 ， 可 以 将 参考 文献 
[2, 20, 29, 30] 中 提出 的 那些 静态 和 动态 缓存 方法 进行 综合 。 

第 二 层 负责 对 象 的 组 织 ， 并 忽略 每 个 对 象 的 具体 特性 。 在 这 种 情况 下 ， 定 义 一 组 
缓存 置换 策略 来 管理 缓存 的 内 容 。 每 个 策略 利用 一 些 属性 来 使 其 保持 对 象 的 有 序 ， 这 
些 属 性 可 以 是 对 象 的 大 小 、TTL 和 最 近 访问 时 间 。 例 如 ，LRU 缓存 策略 根据 对 象 的 最 
近 访 问 时 间 来 维持 一 个 缓冲 区 ， 以 保持 对 象 有 序 排 列 ， 以 此 作为 对 象 置换 的 依据 。 不 
同 于 上 一 层 使 用 的 SIDU 接口 ， 本 层 引 人 了 缓存 分 区 的 概念 ， 即 静态 缓存 分 区 和 动态 
缓存 分 区 。 

第 三 层 定 义 了 一 个 更 高 级 别 的 内 容 管 理 逻 辑 。 相 对 于 前 两 层 ， 这 一 层 关注 的 是 实 
际 的 内 容 类 型 和 对 象 的 特性 。 每 个 内 容 类 型 可 以 表示 为 具有 分 层 结构 的 一 组 对 象 
(片段 ) 。 例 如 ， 一 个 动态 页 面 代表 了 一 组 对 象 ， 表 示 构 成 页 面 的 一 组 可 缓存 的 片段 。 
因此 ， 在 较 低 层次 上 对 对 象 的 抽象 提供 了 解决 内 容 多 样 性 的 统一 方法 。 另 一 种 高 层 的 
结构 是 服务 ， 代 表 了 在 CDN 层面 上 的 任何 操作 。 这 些 服务 可 以 仅 供 内 部 使 用 (如 代 
理 缓存 服务 器 之 间 的 协作 ) ， 并 只 供 CDN 使 用 ， 否 则 就 是 公共 服务 ， 如 动态 网 页 的 显 
示 和 传输 。 因 此 ， 可 以 提供 适当 的 服务 来 解决 缓存 的 一 致 性 问题 。 此 外 ， 不 可 缓存 的 
内 容 ( 按 需 更 新 ) 可 以 通过 那些 能 实时 创建 内 容 的 服务 来 处 理 。 

365.2 总 结 了 CDNsim 中 各 种 缓存 问题 和 架构 部 件 之 间 的 对 应 关系 。 具 体 来 说 ， 
CDNsim 直接 支持 静态 、 动 态 和 综合 的 缓存 方案 ， 其 中 每 个 都 可 以 建 模 为 缓存 分 区 。 
CDNsim 为 任何 静态 副本 放置 算法 提供 了 一 种 通用 的 输入 ， 而 默认 情况 下 它 支 持 LRU 
动态 缓存 。 缓 存 的 一 致 性 由 一 组 服务 管理 ， 这 些 服务 发 出 各 种 内 容 更 新 信号 并 提交 发 
生 的 改变 。 缓 存 一 致 性 实现 于 第 三 屋 ， 在 默认 情况 下 CDNsim 提供 缓存 的 强 一 致 性 。 
复杂 的 内 容 类 型 如 音频 、 视 频 、 网 页 及 流 内 容 都 可 以 通过 对 象 的 分 层 结构 得 到 支持 ， 
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每 个 类 型 都 可 以 由 一 组 可 缓存 的 对 象 代表 。 与 一 致 性 服务 相 结合 ， 可 以 对 动态 内 容 的 
更 新 实现 缓存 ， 不 可 缓存 内 容 可 以 通过 第 三 层 上 的 一 组 特定 服务 单独 处 理 。 


表 5.2 缓存 问题 与 CDNsim 架构 部 件 之 间 的 映射 








缓存 问题 CDNsim 默认 值 
静态 /动态 缓存 分 区 缓存 分 区 ， 易 变 / 非 易 变 一 般 性 支持 /LRU 
复杂 内 容 MR. RC 
RTRW TAMERS WR | 一 般 性 支持 
按 需要 更 新 ， 不 可 缓存 的 动态 内 容 不 明 


5.4.4 ”实现 的 问题 


这 里 介绍 CDNsim 方案 中 缓存 策略 的 具体 实现 ， 可 以 为 开发 相关 软件 的 人 员 提 供 
一 些 有 益 的 参考 。 本 节 使 用 了 一 个 有 代表 性 的 例子 ， 在 该 例 中 代理 缓存 服务 器 中 包含 
用 于 静态 和 动态 内 容 的 分 区 缓存 ” 。 缓 存 的 静态 部 分 使 用 的 是 一 个 副本 置换 算法 ， 
而 动态 部 分 使 用 LRU。 选 择 LRU 是 因为 很 多 人 对 它 很 熟悉 ， 也 易于 掌握 。 本 节 的 目 
标 是 实现 一 个 符合 前 述 架 构 和 性 能 需求 的 缓存 。 

1. 第 一 层 

该 层 主 要 关心 的 是 对 类 对 象 和 缓存 的 实现 。 既 然 要 创建 一 个 结合 静态 和 动态 的 组 
存 策略 ， 那 么 就 需要 定义 易 变 对 象 和 非 易 变 对 象 这 两 个 类 别 。 一 个 属于 非 易 变 类 的 对 
象 被 存储 于 静态 缓存 ， 而 当 一 个 对 象 被 定义 为 易 变 对 象 时 ， 它 在 运行 时 将 存储 于 动态 
缓存 中 ， 并 可 能 在 将 来 被 缓存 置换 策略 从 缓存 中 移 除 。 

内 存 的 低 消耗 被 定义 为 一 个 次 要 的 需求 ， 这 时 需要 使 用 一 个 方法 来 实现 信息 压缩 
和 缓存 置换 能 力 的 平衡 。 

1) 完全 压缩 一 一 无 信息 。Bloom 滤波 器 "是 一 个 用 于 模拟 缓存 的 方法 。 该 滤波 
器 是 一 个 对 信息 打包 的 位 数组 。 从 缓存 的 角度 看 ， 上 面 所 说 的 信息 是 指 对 象 的 标识 。 
定义 在 这 个 位 数组 上 的 操作 有 读 、 使 能 和 禁用 ， 一 组 不 同 的 哈 希 函 数 把 每 一 个 需要 插 
人 的 标识 映射 到 这 个 数组 中 的 若干 位 。 该 方法 的 优点 是 执行 速度 快 ， 因 为 它 使 用 与 操 
作 ， 运 行 在 本 地 主机 的 CPU 之 上 ， 内 存 的 需求 也 较 小 。 然 而 ,使 用 哈 希 函数 会 导致 
冲突 ， 不 同 对 象 的 标识 可 能 对 应 相同 的 位 ， 这 会 导致 不 准确 的 内 容 描述 。 而 且 ， 对 象 
的 一 些 相关 信息 无 法 利用 ， 例 如 一 些 属性 (如 最 近 访 问 时 间 ) 不 能 得 到 存储 ， 这 就 
使 我 们 不 能 实现 LRU 之 类 的 缓存 置换 算法 。 

2) 部 分 压缩 一 一 部 分 信息 。 顾 名 思 义 ， 这 个 方法 仅 使 用 部 分 的 Bloom 滤波 器 技 
术 和 对 象 信息 ” 。 在 完整 的 对 象 信息 表示 中 ， 每 一 个 对 象 是 一 个 实际 的 C + + 对象， 
它 存储 所 有 必要 的 属性 ， 如 对 象 的 大 小 和 最 近 访问 时 间 等 。 然 而 ，Bloom 滤波 器 会 导 
致 信息 的 损失 ， 从 而 不 能 执行 LRU。 

3) 无 压缩 一 一 完整 信息 。 完 整 的 对 象 信息 适 于 实现 LRU， 因 为 对 象 的 所 有 属性 
都 是 可 用 的 。 看 下 面 这 个 例子 : 在 32 位 系统 中 需要 16B 表示 一 个 对 象 ， 其 中 标识 用 
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4B、 最 近 访 问 时 间 用 8B、 对 象 大 小 用 4B。 这 样 ， 在 大 小 为 2GB 的 内 存 中 大 致 可 以 存 
储 1.3 亿 个 对 象 。 因 此 ， 即 使 存在 着 其 他 原因 的 内 存 需求 ， 一 个 标准 的 主机 仍 可 以 管 
理 几 百 万 个 对 象 。 这 里 ， 不 允许 使 用 无 损 的 压缩 方法 ， 因 为 耗 时 的 解压 和 再 压缩 会 导 
致 性 能 的 下 降 。 因 此 ， 建 议 对 象 与 其 标识 之 间 使 用 一 一 对 应 的 方式 ， 且 所 有 SIDU 操 
作 的 算法 复杂 度 都 是 O(1) 。 

2. 第 二 层 

该 层 使 用 缓存 策略 实现 对 内 容 的 组 织 。 缓 存 策略 分 为 两 种 : BASRA LRU, f 
态 缓存 的 内 容 在 默认 情况 下 保持 不 变 ， 因 此 被 存储 的 对 象 不 需要 保持 某 种 有 序 性 。 标 
识 和 对 象 之 间 使 用 一 一 对 应 就 可 以 满足 需要 ， 并 且 SIDU 的 算法 复杂 度 都 是 0(1) 。 

而 LRU 则 需要 特殊 处 理 。 因 为 LRU 需要 将 最 久未 被 使 用 的 对 象 移 除 ， 所 以 就 要 
求 根 据 最 近 访 问 时 间 保 持 对 象 的 有 序 。CDNsim 使 用 一 个 缓冲 区 ， 缓 冲 区 内 的 对 象 按 
最 近 访 问 时 间 排 序 ， 如 图 5.5 所 示 。 这 个 缓冲 区 不 存储 实际 的 对 象 ， 实 际 的 存储 由 组 
存 负 责 ， 缓冲 区 只 用 于 实现 对 象 标 识 的 排序 。 搜 索 操 作 的 算法 复杂 度 在 最 坏 情况 下 为 
O(n) ， 这 是 由 于 搜索 对 象 时 必须 对 整个 缓冲 区 顺序 扫描 。 插 入 操作 的 算法 复杂 度 为 
0(1) ， 因 为 新 对 象 是 被 插 人 到 缓冲 区 的 开始 位 置 ( 头 部 ) ， 如 果 需 要 的 话 缓冲 区 末端 
(尾部 ) 的 一 些 对 象 要 被 移出 以 释放 空间 。 删 除 操作 的 算法 复杂 度 为 0(1) ， 因 为 只 
需 在 找到 被 删除 对 象 后 从 缓冲 区 中 删 掉 它 ， 并 不 需要 重新 排序 。 更 新 操作 的 复杂 度 也 
是 0(1) ， 因 为 一 旦 找到 对 象 就 可 以 立刻 更 新 它 ， 不 需要 重新 排序 。 显 然 ， 搜 索 操 作 
是 SDU 操作 中 使 用 最 多 的 ， 其 时 间 复 杂 度 在 最 坏 情况 下 是 0(n) ， 可 能 会 降低 缓存 
的 速度 。 然 而 ， 这 完全 可 以 忽略 ， 原 因 有 二 : 首先 ， 借助 于 CPU 内 的 高 速 缓存 ,性 
能 只 会 受到 很 小 的 影响 ; 其次， 搜索 的 目标 是 最 近 使 用 的 对 象 ， 所 以 只 需 在 缓冲 区 的 
开始 部 分 检查 很 少 的 对 象 。 虽 然 搜索 操作 在 实际 中 表现 出 令 人 满意 的 性 能 ， 但 还 是 需 
要 进一步 改进 。 例 如 ， 通 过 维护 一 个 额外 的 直接 指向 缓冲 区 内 所 有 对 象 的 索引 ， 就 可 
以 获得 O(1) 的 算法 复杂 度 。 


存储 的 对 象 








最 久未 使 用 的 对 象 最 近 使 用 的 对 象 
( 队 尾 ) (Ak) 


图 5.5 LRU 缓冲 区 
另 一 个 问题 是 ， 当 同时 访问 内 容 时 可 能 会 造成 资源 死 锁 和 内 容 的 不 一 致 性 。 这 个 
问题 可 以 通过 创建 被 请 求 内 容 的 私有 副本 来 解决 。 因 此 ， 高 层 的 服务 只 处 理 内 容 的 私 
有 副本 。 
3. 第 三 层 
本 层 中 不 涉及 缓存 问题 ， 因 为 它们 已 经 由 低层 解决 ， 软件 开发 人 员 可 以 自由 地 实 
现 那 些 对 内 容 进 行 响应 和 分 发 的 服务 。 
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5.4.5 实验 结果 


参考 文献 [30] 中 的 一 系列 的 实验 验证 了 存储 器 分 区 策略 在 Web 缓存 和 内 容 复 
制 上 的 效果 ， 本 节 将 简要 地 介绍 该 策略 的 一 些 实验 结果 。 验 证 的 标准 包括 : 

1) 平均 响应 时 间 。 这 是 请 求 服务 时 间 的 数学 期 望 ， 即 所 有 的 请 求 时 间 除 以 请 求 
数 ， 较 低 的 值 表示 内 容 离 终端 用 户 较 近 。 

2) 响应 时 间 CDF。 在 本 节 的 实验 中 ， 累 计 分 布 函数 (CDF) 表示 响应 时 间 小 于 
或 等 于 一 个 给 定时 间 的 概率 。CDN 的 目标 是 提高 响应 时 间 位 于 其 下 界 附 近 的 概率 。 

3) 命中 率 。 命 中 率 定 义 为 缓存 命中 数 除 以 总 的 请 求 数 。 一 个 高 的 命中 率 代表 了 
一 个 有 效 的 缓存 置换 策略 以 及 对 用 户 的 服务 水 平 的 提高 和 平均 延 时 的 下 降 。 

. 4) 字 节 命中 率 。 这 是 以 字 节 形式 表示 的 命中 率 ， 定 义 为 缓存 中 请 求 命中 的 字 节 
总 数 除 以 请 求 的 字 节 数 。 一 个 高 的 字 节 命中 率 表示 网 络 性 能 的 提高 ( 即 带 宽 的 节省 
和 低 的 拥塞 等 ) 。 

下 面 对 静 态 复 制 在 不 同 综合 度 (r, c) 时 LRU, LFU 和 SIZE 算法 的 性 能 进行 了 
验证 ， 其 中 r+ 和 < 分 别 表示 用 于 静态 复制 和 Web 缓存 的 存储 容量 的 所 占 比 例 。 实 验 中 
使 用 的 静态 复制 算法 是 il12p"" ， 它 使 用 了 服务 器 的 负载 信息 。 具 体 地 讲 ，il2p 分 为 
两 步 : 选择 放置 哪个 对 象 以 及 放置 到 哪里 。 首 先 ， 根 据 网 络 延 时 最 小 的 原则 为 每 个 对 
象 选择 合适 的 代理 缓存 服务 器 ; 其 次 ， 在 给 定 的 所 有 “对 象 一 代理 缓存 服务 器 ” 备 
选 对 中 ， 选 择 能 产生 最 大 效用 值 (取决 于 服务 器 的 负载 ) 的 那 一 对 。 这 个 选择 的 实 
现 是 一 个 迭代 的 过 程 ， 直 到 所 有 的 缓存 填 满 为 止 。 基 于 完整 考虑 ， 实 验 还 包括 全 镜像 
( 即 整个 Web 站 点 被 复制 到 缓存 ) 和 空 盘 (用 于 模拟 不 使 用 CDN 的 情况 ) 。 为 了 满足 
实验 的 要 求 ， 使 用 了 Stanford 的 Web 站 点 ?>。 在 这 种 情况 下 ， 利 用 CDNsim 创建 了 一 
个 CDN， 对 数 千 个 用 户 和 网 络 资源 进行 模拟 。 

图 5.6 显示 了 静态 复制 和 缓存 的 不 同 参数 组 合 对 平均 请 求 响 应 时 间 的 影响 。 只 使 

用 静态 复制 ( 即 >=100% ) 时 ,会 产生 最 大 的 平均 响应 时 间 。 这 个 事实 说 明 ， 副 本 
放置 位 置 固定 不 变 时 不 能 应 对 用 户 对 内 容 需 求 的 变化 。 从 图 中 可 以 发 现 两 个 不 同 的 性 
能 峰值 ， 第 一 个 出 现在 r=80% 和 c=20% 时 ,第 二 个 在 c=100% 时 。 缓 存 的 动态 分 
区 只 增 大 20% ( 即 第 一 个 峰值 ) 就 得 到 了 显著 的 性 能 提高 。 这 个 现象 是 符合 逻辑 的 ， 
因为 在 实验 中 根据 用 户 的 请 求 为 新 的 需要 存储 的 内 容 打 开 一 部 分 缓存 ， 而 同时 静态 副 
本 又 保持 在 一 个 il2p 建议 的 有 效 数量 。 随 着 动态 分 区 所 占 比 例 的 增加 ， 复 制 所 具有 
的 那些 原本 不 错 的 性 质 逐 渐 形 失 。 引 起 这 个 现象 的 原因 是 ， 绥 存 置 换 策 略 可 能 移 除 了 
有 用 的 内 容 ， 而 根据 il2p 策略 这 些 内 容 应 该 保持 在 缓存 中 。 缓 存 方案 的 性 能 (第 二 
个 峰值 处 ) 表现 得 比 综合 方案 (第 一 个 峰值 处 ) 稍 好 一 点 ， 一 个 可 能 的 原因 是 : 将 
整个 存储 空间 用 于 缓存 置换 可 以 使 Web 缓存 方案 有 效 地 适应 用 户 的 流量 模式 。 不 仅 
如 此 ， 因 为 Stanford 网 站 中 的 对 象 基本 都 较 小 ， 这 就 使 性 能 在 缓存 未 命中 的 时 候 只 有 
一 个 小 的 下 降 。 然 而 ,缓存 并 不 是 一 个 完美 的 选择 ， 因 为 这 时 CDN 变 成 了 一 个 代 
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平均 响应 时 间 





0 
100% r0% c 80% r20% c 50% r 50% c 20% r 80% c 0% r 100% c 
复制 (7) 和 缓存 (c) 的 比例 


图 5.6 平均 响应 时 间 


理 服 务 器 ， 从 而 带 来 了 一 个 代理 服务 器 所 具有 的 所 有 扩展 性 问题 。 另 一 个 重要 的 事实 
是 ， 所 有 的 缓存 置换 算法 都 有 一 个 相同 的 表现 ， 即 结合 SIZE 后 性 能 都 会 变 得 稍 好 一 
些 。SIZE 的 优越 之 处 可 以 被 解释 为 ， 新 的 对 象 获得 了 更 多 的 空间 ， 从 而 提高 了 缓存 
空间 的 利用 率 。 

从 命中 率 的 角度 来 说 ， 在 图 5.7 中 可 以 看 到 与 图 5.6 中 相同 的 两 个 峰值 。 纯 粹 
的 Web 缓存 方案 得 出 了 与 综合 方案 类 似 的 结果 ， 而 纯 静 态 复制 则 没有 。 在 整个 存 
储 空间 中 固定 放置 副本 的 方案 出 现 了 低 命中 率 的 现象 ， 这 是 由 于 宛 余 的 内 容 被 移 
除 而 置换 却 不 是 最 优 的 。 不 能 获得 最 优 置 换 的 原因 在 于 : 用 户 请 求 模式 的 改变 以 
及 它 是 一 个 NP 一 完全 问题 。 这 个 原因 也 揭示 了 为 什么 纯粹 的 Web 缓存 只 是 在 性 能 
上 稍微 优 于 综合 的 方案 。 图 5. 8 显示 的 是 字 节 命中 率 的 实验 ， 出 现 了 与 上 述 情况 相 
似 的 结果 。 


命中 率 





100% r 0% c 80% r20% c 50% r 50% c 20% r 80% c 0% r 100% c 
复制 (r) 和 缓存 (c) 的 比例 
图 5.7 命中 率 
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1.0 
3c4 
--LRU 
-i-LFU 
0.8 一 SIZE 
一 "d 
* 
T 06 p. 
M 0.4 A —M— © 
0.2 
Om - ------------------------ = 
100% r 096 c 80% r 2095 c 50% r 50% c 20% r 80% c 0% r 100% c 
复制 (r) 和 缓存 (c) 的 比例 
图 5.8 . 字 节 命中 率 


图 5. 9 给 出 了 请 求 服务 时 间 分 布 的 一 个 更 精确 的 表示 ， 读 者 可 以 注意 第 一 个 性 能 
峰值 (r =80% ，c=20% ) 。 忽 略 全 镜像 这 种 理想 情况 ， 可 以 看 出 综合 方案 (SIZE/ 
il2p) 具有 最 好 的 性 能 ， 取 得 了 比 其 他 方案 更 短 的 响应 时 间 (其 性 能 曲线 在 所 有 其 他 
曲线 的 上 面 ) 。 对 实验 结果 的 分 析 如 下 : “ 


CDF 响 应 时 间 





"n 05 10 1.5 2.0 25 3.0 35 40 4.5 5.0 
响应 时 间 
Bg 5.9 响应 时 间 的 累积 分 布 函数 


1) 至 少 有 一 个 性 能 上 的 峰值 属于 缓存 和 复制 的 综合 方案 。 

2) 综合 方案 可 能 由 于 副本 放置 的 效率 不 够 理想 而 造成 性 能 的 下 降 。 

3) 在 某 些 特殊 的 缓存 中 ， 纯 缓存 方案 的 性 能 与 综合 方案 一 样 好 ， 但 还 是 不 建议 
使 用 它 ， 因 为 它 继承 了 代理 服务 器 的 所 有 缺点 。 

上 述 结果 表明 ， 通 过 将 Web 缓存 的 特性 引入 到 CDN 中 ， 可 以 使 性 能 具有 现实 的 
改进 空间 。 
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5.5. 与 给 使 用 者 


CDNsim 是 一 个 可 用 于 研究 和 商业 用 途 的 免费 、 开 放 的 工具 ， 有 两 个 主要 的 用 户 
群体 可 以 从 中 受益 : CDN 的 开发 者 和 对 CDN 感 兴趣 的 软件 开发 人 员 。 这 节 中 ,我 们 
讨论 怎样 使 用 CDNsim。 

对 于 第 一 个 群体 来 说 ，CDN 提供 商 的 兴趣 在 于 最 大 化 其 网 络 设施 的 效用 。 为 了 
实现 这 个 目标 ，CDN 开发 者 们 设计 了 专用 算法 来 有 效 地 管理 内 容 ， 其 很 自然 的 结果 
就 是 新 产品 的 面世 。 从 CDN 的 角度 来 看 ， 这 个 新 产品 是 一 个 新 的 内 容 分 发 服务 ， 如 
视频 流 和 大 文件 的 分 发 等 。 虽 然 每 个 服务 ?可 能 在 功能 上 互 不 相同 , 但 所 有 服务 的 生 
命 周 期 都 存在 着 一 系列 相同 的 阶段 。 

1. 服务 发 布 前 

这 个 阶段 涉及 服务 提交 给 用 户 之 前 的 开发 过 程 。CDNsim 可 以 在 开发 阶段 使 用 ， 
用 于 原型 的 设计 和 实现 ， 以 形成 最 初 的 产品 规划 。 一 旦 完成 了 原型 开发 ， 可 以 用 
CDNsim 来 评估 实验 室 条 件 下 原型 在 各 种 网 络 配置 和 流量 模式 下 的 性 能 和 表现 。 从 测 
试 和 构建 原型 到 取得 一 定 的 成 熟 度 ，CDNsim 可 以 显著 地 降低 设施 的 投资 。 随 后 ， 就 
可 以 在 真实 的 CDN 环境 中 进行 评估 。 使 用 CDNsim 构建 原型 和 测试 的 一 个 实际 例子 是 
近期 由 Akamai 开发 的 高 定义 视频 流 ” 。 

2. 服务 发 布 后 

当 服务 向 更 广泛 的 公众 发 布 时 ， 它 应 该 已 经 通过 了 一 系列 的 测试 ， 而 且 也 应 该 对 
服务 的 表现 和 性 能 形成 一 套 文档 化 的 结论 。 但 是 ， 由 于 这 时 产品 运行 在 一 个 尚未 测试 
过 的 新 环境 中 ， 服 务 的 性 能 表现 可 能 会 与 初始 的 结论 发 生 偏差 。CDNsim 可 以 用 于 复 
现 一 个 有 问题 的 或 意料 外 的 环境 ， 以 帮助 分 析 人 员 搞 清 为 什么 会 出 现 那 些 偏 差 。 因 
此 ,在 不 希望 出 现 的 局 面 发生 之 前 ，CDNsim 可 以 用 做 预防 机 制 。 例 如 ，Limelight 
Networks 对 世界 杯 足球 赛 进行 一 次 世界 范围 内 的 播报 之 前 ， 显 然 很 有 必要 进行 行为 预 
测 和 灾难 预防 。 

3. 服务 的 完善 期 

最 终 ， 一 个 服务 将 达到 某 种 程度 的 成 熟 性 、 稳 定性 和 正确 性 。 然 而 ， 服 务 的 运行 
环境 (网络 配置 、 典 型 的 用 户 群 、 当 前 的 技术 等 ) 是 不 断 变化 的 。 有 代表 性 的 例子 
是 互联 网 快速 连接 的 增加 和 因 可 用 IP 地 址 不 断 减 少 导致 的 IPv6 ER UU 。 可 以 用 
CDNsim 进行 一 个 假设 分 析 : 服务 是 如 何 随 着 用 户 群 体 的 增 大 而 扩展 的 ?用户 连 接 会 
变 得 越 来 越 快 ， 服 务 和 当前 设施 能 不 能 跟 上 这 一 变化 ? CDNsim 能 够 通过 调整 相应 的 
网 络 配置 来 验证 这 些 问 题 。 如 果 不 能 预测 这 个 长 期 的 演化 趋势 ， 就 无 法 及 时 投资 更 新 
网 络 设施 ， 最 终 导致 客户 的 流失 。 

对 于 第 二 个 目标 群体 ， 鼓励 软件 开发 人 员 扩 展现 有 的 架构 ， 以 适应 算法 的 最 新 发 


O 这 里 ,“ 服 务 ” 这 个 术语 一 般 指 内 容 分 发 服务 。 一 一 原 书 注 
© http; //www. akamai. com/。 一 一 原 书 注 
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展 趋势 。 估 计 CDNsim 将 发 展 为 一 个 综合 性 的 测试 平台 ， 其 中 将 包含 一 整套 用 于 比较 
和 测试 性 能 的 缓存 算法 。 不 仅 如 此 ，CDNsim 可 以 在 并 行 环境 中 运行 ， 高 性 能 计算 的 
研究 者 可 以 将 其 作为 一 个 在 CDN 环境 中 实现 并 行 算法 测试 的 平台 。 因 此 ， 有 人 对 组 
存 算 法 的 设计 和 实现 提出 了 一 些 设想 ， 以 期 利用 新 的 多 核 处 理 器 的 优势 和 采用 新 的 更 
有 效 的 数据 结构 。 进 一 步 的 研究 方向 将 在 下 一 节 介 绍 。 


5.6 未 来 研究 方向 


CDNsim 也 许 在 内 容 分 发 领域 的 研究 方向 上 提供 了 新 的 视角 ， 下 面 对 CDNsim 的 
应 用 场合 提出 一 些 建议 。 

1. 内 容 分 发 

CDN 面临 着 一 些 问 题 ， 如 : 在 哪儿 放置 代理 缓存 服务 器 ? 哪些 内 容 应 该 转 由 
CDN 分 发 ? 如 何 实现 分 发 的 外 包 ? 对 这 些 问题 业界 有 着 不 同 的 看 法 。 显 然 ， 对 于 
CDN 提供 商 来 说 ， 在 这 些 问题 上 的 每 个 决策 都 会 产生 不 同 的 成 本 和 局 限 。 在 CDNsim 
这 个 框架 下 ， 不 仅 能 够 在 一 个 大 范围 内 用 于 对 各 种 策略 进行 评估 ， 也 可 以 用 于 挖掘 组 
存 所 带 来 的 收益 。 

2. CDN 服务 的 定价 

这 是 CDN 提供 商 管理 层面 临 的 一 个 带 有 挑战 性 的 问题 。 对 新 服务 (如 EdgeSu- 
ite) 的 部 署 ， 总 是 伴随 着 定价 和 服务 的 问题 。 第 8 章 探 讨 了 一 些 定 价 的 问题 ， 并 介绍 
了 一 些 定价 模型 ， 使 用 CDNsim 可 以 对 它们 进行 验证 。 

3. 移动 CDN 

无 论 在 学 术 圈 还 是 业界 ， 移 动 无 线 网 络 的 内 容 分 发 都 是 一 个 既 重 要 又 吸引 人 的 新 
课题 。 考 虑 到 最 近 在 移动 内 容 联 网 (如 WAP、IPv6 等 ) 方面 的 进展 ， 在 无 线 Web 新 
技术 的 采用 方面 ， 移 动 CDN 设施 可 能 将 发 挥 主导 作用 (移动 CDN 将 在 第 14 章 详细 
介绍 ) 。CDNsim 可 以 用 做 测试 平台 ， 在 移动 CDN 领域 开拓 新 的 研究 思路 。 

4. 对 等 CDN 

在 科研 人 员 中 ， 对 等 CDN 的 知名 度 正在 不 断 上 升 。 在 对 等 CDN 问题 上 ,目前 已 
经 提出 了 一 些 方法 , 但 有 些 关键 问题 尚 待 解 决 ， 包 括 何 时 使 用 对 等 及 如 何 实现 对 等 ， 
第 16 章 将 详细 讨论 这 些 问题 中 的 部 分 内 容 。CDNsim 可 以 在 实际 流量 、 工 作 负 载 和 复 
制 等 条 件 下 模拟 对 等 CDN 框架 ， 同 时 它 也 可 以 用 于 对 提出 的 对 等 CDN 框架 中 的 负载 
测量 、 请 求 重 定向 、 内 容 复 制 的 最 佳 方法 和 最 新 技术 进行 评估 。 

5. CDN 的 安全 性 

互联 网 电子 商务 的 快速 发 展 已 经 引起 了 对 CDN 数据 安全 问题 的 很 大 关注 5 。 在 
这 个 背景 下 ， 应 该 研究 安全 的 内 容 分 发 协议 以 保证 内 容 的 完整 性 〈 即 被 未 经 授权 的 
实体 修改 过 的 内 容 不 应 接受 ) 和 机 密 性 ( 即 分 发 的 内 容 不 能 被 未 经 授权 的 代理 服务 
右 或 请 求 者 之 外 的 其 他 用 户 等 非 授 权 实体 浏览 ) 。CDNsim 高 度 的 扩展 性 允许 研究 人 
员 在 其 设施 上 完善 自己 的 协议 (W iDeliver?? ) , 
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6. CDN 中 的 P2P 和 网 格 技术 

既然 CDN 是 复杂 的 大 规模 分 布 式 系统 ， 其 发 展 可 以 得 到 POP 和 网 格 等 新 技术 的 
支持 。 在 CDN 设施 上 成 功 地 开发 、 集 成 这 些 模 型 和 技术 将 会 有 效 地 解决 前 述 问题 ， 
同时 也 有 助 于 开发 更 有 效 的 CDN。CDNsim 架构 能 够 很 容易 地 增强 上 述 新 技术 。 


5.7 结论 


目前 ，Web 已 经 取得 了 快速 的 发 展 ， 从 一 个 简单 的 只 提供 静态 文本 和 图 片 的 共 
享 机 制 发 展 为 可 以 提供 多 种 动态 和 交互 服务 ， 如 视频 /音频 会 议 、 电 子 商务 及 远程 教 
育 等 。 然 而 ，Web 的 快速 发 展 已 经 对 建 网 资源 和 Web 内 容 提 供 商 提 出 了 巨大 的 要 求 。 
从 遥远 的 站 点 上 获取 网 页 时 ， 用 户 常 体验 到 很 大 的 和 无 法 预测 的 延 时 。CDN 设施 也 
许 能 有 效 地 解决 Web 的 容量 和 性 能 问题 ， 因 此 越 来 越 多 的 Web 内 容 提供 商 依靠 CDN 
实现 内 容 的 分 发 。 为 了 满足 这 些 不 断 增长 的 要 求 , 解决 问题 的 关键 在 于 对 CDN 内 容 
复制 的 管理 。 具 体 来 说 ,为 了 改善 Web 信息 的 分 发 ， 必 须 进一步 研究 各 种 Web 数据 
缓存 的 技术 和 机 制 。 

本 章 介 绍 了 用 于 CDN 模拟 框架 的 各 种 新 出 现 的 缓存 技术 ,研究 了 如 何 将 缓存 策 
略 集成 到 CDN 的 设施 中 。 另 外 ， 本 章 也 对 CDN 的 缓存 一 致 性 机 制 进行 了 全 面 的 综 
WR, HEM, MAT CDN 环境 中 用 于 动态 内 容 分 发 的 缓存 技术 。 最 后 ， 在 CDN 分 析 模 
WTA CDNsim 中 对 这 些 技术 的 效果 进行 了 验证 。 

综 上 所 述 ，CDN 的 发 展 仍然 处 于 一 个 早期 阶段 ， 其 未 来 的 发 展 尚 无 定论 。 目 前 
的 关键 是 要 理解 现存 的 与 CDN 框架 有 关 的 应 用 实践 ， 以 提出 或 预测 其 发 展 脉络 。 基 
于 这 个 考虑 ， 与 缓存 技术 有 关 的 实践 似乎 为 CDN 的 进一步 发 展 提供 了 一 个 有 效 的 路 
线 图 。 
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第 6 章 动态 内 容 的 请 求 重 定 问 


Supranamaya Ranjan 
— 
6.1 引言 


WWW 作为 一 种 无 处 不 在 的 媒介 ， 用 户 对 它 的 依赖 不 断 增长 ， 越 是 在 某 个 Web 
服务 不 可 用 的 时 候 这 一 点 就 变 得 越 明 显 。 而 且 ， 由 于 目前 访问 带宽 比 十 年 前 快 得 多 ， 
用 户 对 Web 服务 质量 的 期 望 值 变 得 更 高 ， 由 此 也 使 他 们 越 来 越 不 能 容忍 网 络 吞 吐 量 
或 响应 时 间 的 恶化 。 网 络 服务 的 崩溃 和 恶化 来 自 两 种 原因 的 过 载 : 一 是 每 日 时 段 
(Time -of - Day) 效应 ， 该 效应 是 指 大 多 数 站 点 的 访问 流量 随 每 天 的 不 同时 段 而 变 
化 ， 即 大 多 数 用 户 更 多 地 在 白天 而 不 是 夜晚 访问 网 络 。 网 络 使 用 高 峰 时 的 流量 有 时 相 
当 于 非 高 峰 时 的 2 ~ 20 倍 """”。 因 此 ， 在 规划 一 个 网 站 的 资源 时 ， 管 理 员 面 临 的 难 
题 是 以 满足 最 大 使 用 量 为 设计 依据 还 是 以 平均 使 用 量 为 设计 基础 ， 而 这 两 者 都 有 其 缺 
点 。 对 于 前 者 ， 它 可 以 得 到 一 个 较 好 的 响应 时 间 ， 但 大 多 数 资源 在 非 高 峰 期 间 可 能 一 
直 处 于 使 用 不 足 的 状态 。 而 且 ， 有 时 对 最 大 流量 的 预测 是 非常 困难 的 ， 这 就 造成 分 配 
资源 的 困难 。 对 于 后 者 ， 它 可 能 在 整体 上 具有 更 好 的 资源 利用 率 ， 但 在 流量 高 峰 期 间 
Web 用 户 可 能 无 法 获得 最 好 的 响应 时 间 。 造 成 崩溃 的 第 二 个 原因 是 瞬时 拥塞 效应 ， 
该 效应 是 指 网 站 的 用 户 数 在 一 个 未 预料 到 的 时 刻 或 以 未 预料 到 的 数量 突然 出 现 激增 。 
一 个 最 众所周知 的 例子 是 1999 年 的 维多利亚 秘密 网 络 广播 (Victoria Secret’ s Web- 
cast) ， 它 一 经 推出 便 立 即 引起 篆 动 ， 吸 引 了 150 万 用 户 ， 远 远 超出 了 网 站 的 吞吐 能 
力 ， 因 此 导致 网 站 瘫痪 ， 使 得 没有 一 个 用 户 能 够 观看 这 场 网 络 直播 。 

为 了 保证 用 户 在 网 络 过 载 情况 下 仍 能 得 到 一 个 满意 的 浏览 体验 ，Web 内 容 提 供 
商 越 来 越 多 地 将 内 容 放置 和 分 发 的 工作 转移 到 CDN (如 Akamai , Limelight Net- 
works"! zy, Mirror Image 4), CDN 最 初 的 目标 是 降低 用 户 访问 数据 时 客户 端 与 内 容 
服务 器 之 间 的 端 对 端 (end -to -end) 响应 时 间 ，CDN 为 此 采用 两 种 方法 : 一 种 是 内 
容 放 置 方法 ， 即 将 内 容 放置 在 距离 用 户 较 近 的 地 方 ; 另 一 种 是 重 定 向 方法 ， 即 将 用 户 
的 请 求 转发 到 最 合适 的 服务 器 。 内 容 放置 方 法 需要 识别 出 热点 (hot spot) 的 位 置 ， 
即 引发 大 量 请 求 的 地 方 ”"” ， 以 便 将 内 容 复制 到 这 些 地 方 。 重 定向 面临 的 问题 则 是 
如 何 选 择 对 这 些 请 求 进行 服务 的 最 佳 服务 器 ，”*”*”!。 本 章 的 目标 是 研究 请 求 
重 定向 的 技术 ， 以 选择 最 佳 的 服务 器 。 这 里 说 是 的 “最 佳 ”可 以 被 定义 为 最 近 的 服 
务 器 ， 或 负载 最 小 从 而 可 用 性 最 高 的 服务 器 ,或 者 两 者 的 混合 。CDN 采取 的 典型 做 
法 是 将 一 个 网 站 的 内 容 复制 到 其 镜像 服务 器 上 。 而 另 一 种 方法 是 ， 大 的 Web 内 容 提 
供 商 可 以 将 它们 的 内 容 托管 到 全 球 范 围 内 的 多 个 服务 器 集群 上 ， 其 中 每 个 集群 包含 一 
组 服务 器 ， 这 些 服务 器 可 以 就 地 处 理 一 个 用 户 的 请 求 。 在 这 种 情况 下 ，CDN 只 是 提 
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供 重 定向 技术 ， 将 用 户 请 求 转 到 最 佳 集群 中 的 最 佳 服务 器 上 。 

一 个 请 求 应 该 由 最 佳 服务 器 来 响应 ， 但 最 佳 服务 器 的 确定 取决 于 内 容 的 类 型 。 一 
般 来 说 ， 静 态 内 容 属 于 网 络 密 集 型 ， 在 整个 时 间 范 围 内 不 发 生变 化 (如 图 片 或 pdf Xx 
件 ) ， 所 以 最 佳 服务 器 就 应 该 选择 离 用 户 最 近 的 那个 。 所 谓 最 近 的 服务 器 ， 其 定义 并 
不 统一 。 一 种 定义 是 距离 用 户 的 跳 (hop) 数 最 少 的 服务 器 。 网 络 跳 数 可 以 定义 为 客 
户 端 与 服务 器 之 间 链 路 上 存在 的 路 由 器 的 个 数 〈 可 以 通过 traceroute 工具 测量 ) ， 也 可 
以 定义 为 客户 端 与 服务 器 之 间 最 短路 由 上 存在 的 自治 系统 (Autonomous System，AS ) 
的 数量 。 最 近 服 务 器 的 另 一 种 定义 是 在 所 有 可 达 的 服务 器 中 ， 通 向 该 服务 器 的 路 径 中 
的 瓶颈 连接 的 网 络 带宽 是 最 大 的 。 最 近 服 务 器 还 可 以 根据 网 络 延 时 的 数学 期 望 最 小 来 
定义 ， 这 时 网 络 延 时 就 是 一 个 瓶颈 连接 的 网 络 带宽 和 跳 数 的 函数 。 

然而 ， 随 着 用 户 浏览 体验 趋 于 个 性 化 ， 内 容 提 供 商 在 其 Web 站 点 上 使 用 的 动态 
内 容 不 断 增多 。 这 种 动态 创建 的 内 容 取 决 于 用 户 的 位 置 、 以 往 的 请 求 以 及 请 求 本 身 的 
特点 (如 最 新 的 股票 报价 或 拍卖 竞价 ) 。 在 这 种 情况 下 ， 一 个 典型 的 网 页 将 包含 动态 
和 静态 的 内 容 片 段 。 不 过 ， 动 态 内 容 对 相关 资源 的 要 求 与 静态 内 容 不 同 。 由 于 动态 内 
容 的 处 理 涉及 创建 新 进程 (如 CGI 脚本 ) 或 访问 数据 库 表 (如 PHP 脚本 ) ， 所 以 相 
对 于 静态 内 容 它 更 属于 计算 密集 型 。 不 仅 如 此 ， 由 于 在 互联 网 核心 处 的 过 度 配置 ” ， 
在 路 由 器 排队 延 时 最 小 时 ， 网 络 主干 之 间 的 延 时 越 来 越 取决 于 光速 的 延 时 。 这 就 意味 
着 ， 为 静态 内 容 设计 的 服务 器 选择 机 制 对 动态 内 容 来 说 可 能 不 是 最 优 的 。 对 于 静态 内 
容 来 说 ， 将 请 求 转发 到 最 近 服 务 器 的 做 法 是 有 意义 的 ， 但 对 于 动态 内 容 来 说 最 佳 服 务 
器 的 选择 机 制 必须 同时 考虑 到 网 络 延 时 和 服务 器 负载 。 在 某 些 条 件 下 将 对 动态 内 容 的 
请 求 转 发 到 最 近 服 务 器 上 也 许 是 有 效 的 ， 但 在 另外 一 些 条 件 下 ， 情 况 可 能 就 不 同 了 ， 
因为 如 果 能 获得 最 小 的 网 络 总 延 时 和 最 小 的 服务 器 平均 处 理 时 间 ， 那 么 也 许 将 请 求 转 
发 到 最 远 的 服务 器 上 反倒 更 好 些 。 

根据 一 个 请 求 在 执行 过 程 中 在 什么 地 方 进行 重 定向 的 决策 ， 请 求 的 重 定向 策略 可 
以 分 为 客户 端 (client - side) 重 定向 或 服务 器 端 (server-side) 重 定向 两 大 类 。 在 
一 个 客户 端 重 定向 策略 中 ， 客 户 端 被 一 个 客户 端 代理 服务 器 重 定向 到 一 个 服务 器 。 如 
Akamai 的 产品 中 ， 这 些 客户 端 代理 服务 器 (也 就 是 边缘 服务 器 ! ) 构成 了 一 个 覆盖 
网 (overlay network) ， 并 使 用 traceroute 和 ping 命令 估计 它们 之 间 以 及 它们 与 内 容 提 
供 商 之 间 链 路 的 延 时 。 当 一 个 客户 端 向 域名 服务 器 查询 某 个 网 站 时 ， 域 名 服务 器 返回 
给 它 三 个 通 向 内 容 托 管 服务 器 的 路 由 : 直接 的 、 最 优 两 跳 和 次 优 两 跳 。 然 后 ， 客 户 端 
在 这 三 条 路 由 上 同时 开始 下 载 ， 并 在 其 中 最 快 的 那个 路 由 上 继续 下 载 。 简 单 地 说 ， 
Akamai 首先 在 网 络 邻 近 度 (network - proximity ) 的 基础 上 选择 三 个 服务 器 ， 随后 根 
据 这 三 个 路 由 的 速度 差异 判断 出 服务 器 的 负载 情况 ， 并 将 其 与 服务 器 距离 因素 结合 起 
来 综合 考虑 。 除 了 这 种 基于 DNS 的 重 定向 技术 ，CDN 也 使 用 URL 的 改写 机 制 ， 即 通 
过 DNS 将 产生 内 容 的 站 点 的 地 址 转换 为 可 以 提供 内 容 服务 的 CDN 客户 端 代理 服务 
器 ， 如 Akamai 将 网 址 www. foo. com/bar. gif 修改 为 al. akamai. net/www. foo. com/ 
bar. gif。 实 际 中 ，URL 的 改写 方式 随 不 同 CDN 而 异 。 

相 比 而 言 ， 在 一 个 服务 器 端的 重 定向 技术 2 中 ， 使 用 客户 端 机 制 先 将 请 求 转发 
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到 一 个 最 初 的 服务 器 集群 ， 然 后 集群 重 定 向 器 将 请 求 重 定 向 到 “最 佳 服务 器 ”( 既 可 
以 是 本 地 的 也 可 以 是 远程 的 集群 )。 本 章 主要 讨论 服务 器 端的 动态 内 容重 定向 算法 ， 
算法 可 以 将 请 求 从 一 个 过 载 的 Web 集群 转发 到 其 远 处 的 一 个 副本 。 不 过 ,读者 会 发 
现 针对 动态 内 容 的 大 部 分 策略 可 以 被 扩展 到 其 他 的 内 容 类 型 (如 静态 内 容 或 流 媒 
Hk). 。 因 此 ， 本 章 介 绍 了 一 个 每 请 求 广 域 重 定向 (per - request Wide - Area ReDirec- 
tion, WARD) 策略 。 根 据 被 请 求 的 服务 是 位 于 远程 (通过 重 定向 ) 还 是 本 地 ， 可 以 
确定 整个 链 路 的 延 时 及 服务 器 处 理 的 总 延 时 是 否 达 到 了 最 小 ， 而 WARD 的 主要 目标 
就 是 借 此 最 小 化 客户 端 在 端 对 端 通信 中 的 延 时 。 特 别 地 ， 客 户 端的 请 求 可 以 先 借助 一 
个 客户 端 重 定向 机 制 转 到 一 个 初始 的 Web 集群 ， 这 个 机 制 既 可 以 是 简单 的 DNS 轮转 
算法 ” ， 也 可 以 是 复杂 的 服务 器 选择 方案 ”] 。 请 求 到 达 初 始 集群 后 ， 一 个 请 求 分 派 器 
使 用 一 个 基于 测量 的 延 时 最 小 化 算法 来 决定 将 请 求 转发 到 一 个 远程 还 是 本 地 服务 器 。 
相对 于 其 他 方法 ( 见 6.2 节 ) ， 集 群 重 定 向 器 结合 链 路 状况 和 服务 器 处 理 延 时 实现 了 
总 延 时 的 最 小 化 。 

本 章 也 提出 了 一 个 简单 的 解析 模型 ， 用 于 分 析 广 域 请 求 重 定 向 方法 对 端 对 端 延 时 
的 影响 。 这 个 解析 模型 可 以 对 WARD 带 来 的 收益 进行 一 个 系统 的 性 能 评估 。 从 这 个 
模型 可 以 发 现 ， 对 于 那些 涉及 动态 内 容 的 网 络 应 用 ， 由 于 对 服务 器 负载 信息 误差 的 容 
忍 度 要 远 远 低 于 对 网 络 延 时 误差 的 容忍 度 ， 所 以 一 个 服务 器 选择 机 制 必须 获得 精细 的 
服务 器 负载 信息 。 这 说 明 ， 对 于 涉及 动态 内 容 的 应 用 ， 一 个 服务 器 端 重 定向 策略 可 以 
取得 比 客户 端 重 定向 策略 更 好 的 性 能 ， 而 后 者 在 与 服务 器 端 策略 相同 的 粒度 和 相似 的 
一 般 性 开销 时 不 能 获得 服务 器 的 负载 信息 。 

最 后 ， 本 章 介绍 了 一 个 概念 验证 测试 平台 的 设计 。 在 这 个 平台 上 ， 比 较 了 WARD 
和 其 他 的 strawman 策略 ， 如 只 考虑 网 络 延 时 或 服务 器 负载 的 重 定 向 方法 以 及 使 用 轮 
转 策 略 的 重 定向 方法 。 这 个 测试 平台 模拟 的 CDN 包括 两 个 地 理 上 很 远 的 Web 集群 ， 
这 两 个 集群 通过 一 个 广 域 连接 相连 ， 连 接 的 往返 时 间 和 拥塞 等 特性 用 Nistnet? 进行 仿 
真 。 每 个 Web 集群 都 是 多 层 结构 ， 包 括 Web 服务 器 层 、 请 求 分 派 层 和 数据 库 层 。 
Web 集群 上 的 应 用 是 一 个 在 线 书 店 ,使 用 TPC - WEE 建 模 。 实 验 结果 显 示 ， 对 
于 一 个 有 300 个 并 发 用 户 的 电子 商务 网 站 ， 广 域 重 定向 可 以 将 平均 响应 时 间 从 5s 降 
低 到 2.3s， 下 降 了 54% 。 

本 章 余下 内 容 安排 如 下 : 在 6.2 节 给 出 了 一 个 当前 重 定向 技术 的 技术 背景 ; 在 
6.3 节 介 绍 了 目前 Web 集群 普遍 使 用 的 多 层 体系 ; 6. 4 节 描 述 了 在 实现 广 域 请 求 重 定 
向 要 求 下 集群 的 系统 架构 ; 在 6.5 节 ， 为 研究 该 架构 开发 了 一 个 排队 模型 ;6.6 35 
中 ， 对 远程 分 派 的 请 求 比例 以 及 不 同系 统 模式 下 的 平均 响应 时 间 进 行 了 定量 分 析 ; 在 
6.7 节 中 介绍 了 测试 平台 的 实现 和 度量 ; 在 6.8 节 给 出 了 一 些 供 使 用 者 参考 的 设想 ; 
最 后 ， 未 来 的 研究 方向 和 本 章 的 结论 分 别 在 6.9 和 6. 10 节 给 出 。 


O DNS 轮转 (round -robin) 是 一 种 用 于 实现 Web 服务 器 负载 均衡 的 调度 算法 ， 在 具有 此 功能 的 
DNS 服务 器 中 ， 一 个 名 字 对 应 多 个 IP 地 址 。 当 被 询问 到 此 名 字 时 ，DNS 服务 器 按 顺 序 把 这 些 TP 地 址 返回 
给 不 同 的 用 户 ， 从 而 实现 网 络 负载 的 均衡 。 一 一 译 者 注 
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6.2 相关 工作 


最 小 化 Web 访问 时 间 的 方法 可 以 分 为 资源 管理 和 请 求 管理 两 类 ， 而 后 者 可 以 分 
为 客户 端 重 定向 和 服务 器 端 重 定向 两 类 。 

一 个 最 小 化 Web 访问 时 间 的 方法 是 确保 集群 有 足够 可 用 的 资源 。 服 务 器 迁移 是 
将 集群 中 未 用 或 负载 较 轻 的 服务 器 分 派 给 那些 被 用 户 大 量 访问 的 应 用 B] 。 服 务 器 迁 
移 需要 将 应 用 的 状态 从 一 个 服务 器 迁移 到 一 个 新 的 服务 器 ， 所 以 迁移 时 间 以 10min 为 
数量 级 。 因 此 ， 服 务 器 迁移 是 一 个 在 长 时 间 ( 数 分 钟 或 数 小 时 ) 运行 中 避免 瓶颈 的 
手段 ， 可 以 用 来 应 对 每 日 时 段 效应 等 情况 。 重 定向 不 仅 能 够 解决 长 时 间 运 行 中 的 瓶颈 
(当然 这 需要 付出 重 定向 的 额外 开销 ) ， 而 且 也 能 解决 短期 瓶颈 (如 瞬时 拥塞 引起 的 
瓶颈 ) 。 服 务 器 共享 与 服务 器 迁移 类 似 ， 不 同 之 处 是 它 只 分 派 一 部 分 的 资源 。 服 务 
器 迁移 和 服务 器 共享 是 互 不 相关 的 请 求 重 定向 方法 ， 建 议 将 这 两 种 机 制 融 合 使 用 。 

相当 一 部 分 研究 工作 集中 在 客户 端 重 定向 机 制 上 ， 如 CDN AR BE. AR 
务 器 选择 技术 ”'”、 缓 存 ”、 镜 像 和 镜像 放置 ””)。 这 些 技 术 都 基于 同样 一 个 前 
提 ， 即 网 络 是 最 主要 的 瓶颈 ， 而 对 动态 内 容 的 处 理 可 以 将 瓶颈 转移 到 集群 中 的 资源 上 
(一 般 是 服务 器 的 CPU) 。 这 些 方法 能 用 于 找到 最 佳 的 初始 集群 ，WARD 的 由 集群 驱 
动 的 重 定向 方法 在 本 质 上 结合 了 服务 器 延 时 和 网 络 延 时 。 

如 果 瓶 颈 没 有 找到 或 它 随时 间 变 化 ， 那 么 一 个 集成 了 客户 端 和 服务 器 端 两 种 机 制 
的 重 定位 方法 则 是 可 能 的 和 有 益 的 。Cardellini 等 人 509 给 出 的 方法 就 是 这 样 的 一 种 混 
合 架 构 : 其 服务 器 端的 重 定 向 机 制 可 以 在 CPU 利用 率 超 过 了 一 个 特定 的 阔 值 时 使 用 
HTTP 重 定向 技术 实现 整个 Web 请 求 的 重 定向 。 他 们 得 出 的 结论 是 ， 服 务 器 端 重 定向 
应 该 有 选择 地 使 用 。 相 比 而 言 ， 本 章 将 服务 器 端 重 定 向 视 为 当前 和 将 来 集群 使 用 的 一 
种 基本 的 机 制 ， 本 章 的 重 定向 机 制 不 是 基于 阔 值 ， 而 是 无 论 CPU 利用 率 为 何 值 都 能 
够 得 到 最 优 的 集群 响应 时 间 。 不 仅 如 此 ，Cardellini 的 设计 策略 孤立 地 看 待 网 络 邻近 
度 和 服务 器 负载 ， 而 本 章 的 重 定向 策略 将 两 者 结合 起 来 。 最 后 ， 本 章 中 将 分 派 器 作为 
集群 架构 中 能 够 在 任何 层 实现 请 求 重 定向 的 一 个 基本 的 构成 模块 ， 而 不 是 等 同 于 HT- 
TP 重 定向 。 

参考 文献 [17, 18, 20, 23, 25, 27, 37] 中 的 方法 是 为 静态 内 容 设计 的 ， 而 另 
一 些 方法 ( 如 参考 文献 [15] 及 Akamai EdgeSuite" 中 使 用 的 方法 ) 是 通过 动态 片段 
缓存 解决 动态 内 容 的 服务 器 选择 问题 。 缓 存 既 可 以 在 客户 端 使 用 ， 也 可 以 在 服务 器 端 
使 用 。 在 客户 端 内 容 的 过 期 时 间 是 利用 cookie 来 设置 ， 而 在 服务 器 端 ( 反 向 代理 服务 
器 ) ， 被 缓存 网 页 的 过 期 与 否 由 收 到 的 数据 库 更 新 操作 来 决定 。 不 过 ， 这 类 方法 有 时 
会 导致 将 失效 的 数据 提交 给 客户 端 ， 或 者 增 大 网 站 开发 和 管理 的 复杂 性 。 缓 存 可 以 对 
那些 使 用 WARD 的 方法 提供 补充 : 如 果 被 请 求 的 内 容 不 在 缓存 中 ， 那 么 该 请 求 可 以 
被 转发 到 一 个 能 最 快 处 理 它 的 本 地 或 远程 的 服务 器 。 

目前 CDN 提供 商 (如 Akamai) 处 理 动态 内 容 时 ， 假 设 大 多 数 CDN 可 以 实现 组 
存 ， 处 理 动态 内 容 的 服务 器 选择 算法 采用 的 是 静态 算法 的 一 个 直接 扩展 算法 。 例 如 ， 
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Akamai 使 用 EdgeSuite 来 处 理 动 态 内 容 ， 它 将 每 一 个 网 页 视 为 由 不 同类 型 的 片段 构 
成 ， 片段 的 类 型 可 以 是 静态 、 动 态 可 缓存 或 动态 不 可 缓存 。 这 样 ， 一 个 由 EdgeSuite 
使 能 的 重 定向 器 可 以 选择 最 近 的 服务 器 来 处 理 静态 和 动态 可 缓存 的 片段 ， 而 将 动态 不 
可 缓存 的 片段 甩 给 源 服务 器 。 然 后 ， 重 定向 器 将 所 有 片段 装配 起 来 返回 给 用 户 。 但 据 
估计 ， 只 有 大 约 60% 的 动态 片段 是 可 缓存 的 ”， 如 果 一 个 网 站 (如 电子 商务 或 拍卖 
网 站 ) 的 内 容 中 不 可 缓存 的 动态 内 容 占 相 当 大 的 比例 ， 那 么 用 户 可 能 会 感觉 到 相当 
长 的 下 载 时 间 ， 因 为 从 源 服务 器 下 载 那些 不 可 缓存 的 片段 占用 了 大 量 的 时 间 。 因 此 ， 
针对 此 类 网 站 的 内 容 分 发 策略 可 以 从 服务 器 端 重 定向 方法 的 使 用 中 受益 。 


6.3 背景 


在 本 节 中 ， 首 先 介绍 Web 集群 的 多 层 架 构 ， 以 及 排队 论 的 一 个 简要 背景 。 
6.3.1 集群 的 架构 


-下面 以 电子 商务 会 话 中 的 请 求 为 例 ， 解 释 图 6. 1 所 示 的 Web 集群 的 多 层 架 构 。 
首先 ， 初 始 集群 收 到 一 个 客户 端的 请 求 。 初 始 集群 的 选择 可 以 依据 客户 端 重 定向 策 
RE, DNS 轮转 或 参考 文献 [17，20] 中 那些 更 复杂 的 策略 。 初 始 集群 收 到 请 求 后 ， 
一 个 分 派 器 使 用 轮转 方式 或 其 他 复杂 策略 "将 请 求 发 送 到 Web 层 的 一 个 服务 器 上 。 
如 果 该 请 求 的 目标 是 一 个 静态 网 页 ， 那 么 它 就 由 一 个 Web 服务 器 来 处 理 ， 接 着 该 服 
务 器 生成 响应 信息 并 将 其 返回 给 用 户 。 如 果 请 求 的 是 动态 内 容 (如 订单 处 理 或 购物 
车 )， 那 么 该 请 求 被 转发 给 应 用 层 的 一 个 服务 器 ， 由 该 服务 器 对 客户 端的 请 求 进行 分 
析 ， 解 析出 所 需 的 全 部 动态 片段 ， 并 产生 相应 的 数据 库 查询 操作 。 至 于 由 哪个 数据 库 
服务 器 处 理 查询 的 操作 ， 则 由 另 一 个 分 派 器 决定 。 最 后 ， 应 用 服务 器 对 数据 库 查 询 操 
作 的 所 有 响应 信息 进行 整理 ， 组 装 为 页 面 返回 给 Web 服务 器 ，Web 服务 器 再 将 其 转 
发 给 客户 端 。 


6.3.2 排队 论 


解析 模型 将 在 后 面 的 6.5 节 给 出 ， 它 将 一 个 服务 器 表示 为 一 个 M/G/1 BAR”? , 
在 一 个 M/G/1 队列 中 ， 连 续 两 个 请 求 之 间 的 到 达 间 隔 时 间 服 从 指数 分 布 ， 对 请 求 的 
服务 时 间 服 从 一 个 任意 的 分 布 ， 其 中 ，M 和 G 分 别 代表 马尔 科 夫 分 布 和 一 般 分 布 
(general distribution) ，1 表示 只 有 一 个 队列 。M/G/1 队列 比 M/M/1 队列 更 一 般 化 ， 
M/M/1 队列 中 请 求 的 到 达 间 隔 时 间 和 服务 时 间 都 服从 指数 分 布 。 不 过 ，M/G/1 队列 
的 一 般 性 越 高 ， 则 付出 的 成 本 就 越 高 。 在 稳定 状态 下 ， 一 个 M/G/1 队列 中 的 任务 数 
不 服从 一 个 一 般 闭 式 (closed form) 的 分 布 ， 不 过 队列 中 任务 数 的 平均 值 和 平均 处 理 
时 间 的 确 存 在 一 般 解 。 

虽然 本 节 用 一 个 M/G/1 队列 表示 一 个 服务 器 ， 但 需要 指出 的 是 ，GZGZ1 队列 应 
该 是 对 一 个 服务 器 更 一 般 也 或 许 是 更 精确 的 表示 。 当 假设 到 达 间 隔 时间 服 从 指数 分 布 
时 ， 隐 含 的 假设 就 是 在 当前 时 刻 到 达 网 站 的 请 求 与 以 往 的 请 求 是 相互 独立 的 。 不 过 ， 
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访问 层 


认证 , DNS， 入 侵 检 测 ， 
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Web 页 面 存储 


数据 库 SQL 服 务 器 


存储 区 域 
=> ma M (SAN) 





图 6.1 集群 的 多 层 架 构 


网 站 收 到 的 请 求 之 间 确 实 存在 一 些 相关 性 ， 例 如 属于 同一 个 会 话 的 那些 请 求 之 间 是 相 
关 的 。 而 且 ， 后 端 层 〈 如 数据 库 层 ) 的 请 求 之 间 可 以 认为 具有 更 大 的 相关 性 ， 因 为 
一 个 Web 请 求 可 能 分 解 为 多 个 相关 的 数据 库 查 询 操作 。 但 为 了 简化 ， 这 里 假设 一 个 
M/G/1 队列 可 以 将 队列 平均 等 待 时 间 表 示 为 一 个 闭 式 的 表达 式 ， 这 就 可 以 推导 出 可 
重 定向 请 求 所 占 的 比例 。 


6.4 重 定向 架构 和 算法 


本 节 介绍 WARD, ， 即 动态 内 容 的 广 域 重 定向 架构 ， 并 给 出 一 个 基于 测量 的 重 定向 
算法 。 
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6.4.1 WARD 


在 CDN 中 ， 服 务 和 应 用 在 集群 之 间 复 制 ， 这 些 集群 之 间 使 用 高 速 连接 。 在 实 
际 中 ， 一 个 操作 员 管 理 在 地 理 上 分 布 于 不 同 地 点 的 多 个 集群 。 首 先 ， 一 个 客户 端 
的 请 求 到 达 一 个 初始 的 集群 。 这 里 ， 初 始 集群 的 选择 方法 可 以 是 静态 或 动态 的 ， 
它们 既 可 以 使 用 简单 的 DNS 轮转 策略 ， 也 可 以 使 用 更 复杂 的 考虑 到 内 容 可 用 性 和 
网 络 延 时 的 策略 ， 其 中 网 络 延 时 是 由 代理 服务 器 按 一 定 的 周期 测量 而 得 "…” 。 图 
6.2 所 示 是 一 个 分 派 器 ， 它 使 用 下 面 将 要 提 到 的 重 定向 算法 ， 隐 含 地 将 请 求 转发 到 
一 个 远程 的 集群 。 重 定向 算法 的 目标 是 将 请 求 进行 重 定 向 , 但 只 有 在 重 定向 到 远 
程 集群 后 节省 的 请 求 处 理 时 间 超 过 请 求 双 向 穿行 于 网 络 主干 中 带 来 的 网 络 延 时 ， 
才 进行 重 定向 操作 。 在 这 种 方式 下 ， 只 对 分 派 器 进行 修改 而 不 改变 其 他 部 分 就 可 
以 使 端 对 端 延 时 得 到 降低 。 





图 6.2 ”利用 数据 库 层 前 置 的 重 定向 器 实现 广 域 重 定向 


因此 ，WARD 为 集群 资源 的 空间 多 路 复 用 提供 了 基础 。 当 某 个 集群 由 于 瞬时 拥 
塞 “” 或 每 日 时 段 效应 ”成 为 一 个 热点 时 ， 其 负载 可 以 被 透明 地 重 定向 到 其 他 的 集 
群 ， 以 确保 网 络 延 时 的 降低 。 例 如 ， 当 我 们 发 现 客户 端 访问 模式 呈现 为 每 日 时 段 效 
应 ， 即 服务 器 利用 率 随 每 天 的 不 同时 段 变 化 时 ， 那 么 就 可 以 利用 这 个 效应 ， 使 每 个 集 
群 不 必 按 照应 付 峰值 的 标准 进行 资源 配置 。 这 样 ， 当 一 个 集群 的 工作 负载 达到 峰值 
时 ， 上 距离 它 几 个 时 区 的 另 一 个 集群 的 负载 将 会 低 得 多 ， 采 用 集群 间 的 重 定向 技术 可 以 
大 大 提高 性 能 。 
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6.4.2 重 定向 算法 


重 定向 算法 的 目标 是 实现 请 求 处 理 时 间 的 最 小 化 ， 即 如 果 一 个 请 求 到 达 集 群 ， 

则 将 请 求 分 派 到 满足 以 下 条 件 的 集群 7 
argmin,(2A,, + T;) (6. 1) 
AF, A NRHA 5j 之 间 的 网 络 延 时 ; 7 为 集群 7 对 请 求 的 处 理 时 间 。 

在 实际 中 ， 位 于 远 处 的 集群 / 对 请 求 的 处 理 时 间 也 不 可 能 事先 知道 ， 但 可 以 通过 
集群 / 的 平均 负载 以 及 请 求 类 型 进行 估计 。 这 样 就 可 以 使 用 一 个 基于 测量 的 算法 ， 其 
中 平均 处 理 时 间 7 用 集群 7 的 平均 负载 p, 和 请 求 类 型 估计 。 在 WARD 中 ， 针 对 每 种 请 
求 类 型 测量 一 个 平均 延 时 与 负载 的 对 应 关系 ， 以 此 实现 对 了 的 估计 。 各 个 集群 之 间 周 
期 性 地 交换 负载 信息 ， 实 现 对 每 个 集群 的 处 理 延 时 的 精确 估计 。 与 之 不 同 的 是 ， 由 于 
集群 之 间 使 用 的 是 高 速 连接 ， 因 此 集群 之 间 的 As 相对 保持 不 变 。 这 样 ， 在 集群 / 收 到 
请 求 后 ， 分 派 器 根据 这 条 请 求 的 类 型 所 对 应 的 延 时 一 负载 对 照 表 ， 使 用 集群 /负载 的 
测量 值 估 计 和 集群 7 的 总 服务 时 间 。 

现在 考虑 男 一 个 策略 : 它 不 是 以 单个 请 求 为 基础 进行 处 理 ， 而 是 计算 被 分 派 到 远 
程 的 请 求 的 比例 。 下 一 节 将 会 提 到 ， 如 果 采 取 某 些 简 化 ， 则 被 分 派 到 远程 的 请 求 与 所 
有 请 求 之 间 应 该 存在 一 个 最 优 的 比率 ， 在 这 个 比率 下 所 有 请 求 的 总 延 时 最 小 。 当 解 算 
出 这 个 比率 后 ， 分 派 器 就 可 以 简单 地 利用 这 个 计算 出 的 概率 对 请 求 进行 重 定 向 。 这 里 
将 上 述 两 种 策略 分 别称 为 每 请 求 (或 每 查询 ) 重 定向 和 概率 重 定向 。 


6.5 性 能 模型 


本 节 讨 论 一 个 广 域 重 定向 的 性 能 模型 。 对 于 给 定 的 工作 负载 、 网 络 延 时 及 处 理 时 
间 的 均值 和 方差 ， 可 以 推导 出 在 延 时 最 小 的 要 求 下 分 派 器 将 请 求 重 定向 到 远程 集群 的 
比例 。 此 外 ， 本 节 计 算 总 响应 时 间 的 均值 ， 包 括 服务 和 等 待 时 间 以 及 端 到 端 网 络 延 
时 。 接 着 ， 进 行 一 个 系统 性 的 性 能 分 析 ， 估 计 最 优 分 派 比率 a ， 并 对 请 求 在 各 种 参 
数组 合 下 (服务 器 负载 、 端 对 端 网 络 延 时 和 请 求 的 平均 处 理 时 间 ) 的 平均 响应 时 间 
进行 预测 。 

图 6.3 显示 的 是 WARD 的 系统 模型 。 到 达 集 群 i 的 请 求 数 可 以 建 模 为 参数 为 和 ,的 
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图 6.3 重 定向 系统 模型 
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泊 松 过 程 。 同 时 ， 使 用 服务 时 间 的 一 般 分 布 (general service time distribution) 建 模 一 
个 单 瓶颈 层 ， 分 布 的 均值 为 x,， 方 差 为 oi。 

现在 考虑 一 个 概率 重 定向 算法 ， 它 将 一 个 请 求 以 概率 a 从 集群 7 重 定向 到 集群 i。 
用 E [T,] 表示 集群 i 处 理 一 个 请 求 的 平均 总 延 时 ，A; 表 示 请 求 从 集群 发 到 集群 i 的 
端 到 端 单程 网 络 延 时 。 

对 于 一 个 含有 个 集群 副本 的 系统 ， 设 4 = | al ,… ,Qi，… ,Qa | 为 请 求 分 派 比 例 
HERE, ELT] = | 7,,…,7,| 为 每 个 集群 的 瓶颈 层 总 延 时 构成 的 向 量 , D = {2A,,,--, 
Aj + A;，… ,24,,| 表示 数据 从 集群 i 到 集群 的 往返 时 间 和 矩阵 ，L = | 和 ,… A AER 
群 分 派 咒 处 的 请 求 到 达 率 向 量 , 针 = {x ，…, 元 | 为 平均 服务 时 间 ，C = fepe, E 是 服 
务 时 间 的 平方 变异 系数 (squared coefficient of variation) 向 量 , 其 中 c= oi/x。 

引 理 : 当 请 求 分 派 比 例 为 4 时 ， 重 定向 策略 的 平均 服务 时 间 为 
(A - L)X (14 C) 

2[1- (A - L)X] 

在 本 章 的 附录 部 分 将 给 出 引 理 1 的 证 明 。 该 证 明 是 基于 M/G/1 队列 平均 等 待 时 
间 的 闭 式 表达 式 ， 从 式 (6.2) 可 以 计算 出 使 所 有 请 求 的 服务 时 间 最 小 的 最 优 分 派 
率 。 设 4 = | aa ,ao 为 最 优 请 求 分 派 率 矩阵 。 

命题 1: 最 优 分 派 比率 4 由 式 (6.3) 给 出 。 

A: L)X (1+C 
A6 rna oth] 
AH, ELT] HX (6.2) 定义 。 
为 了 求解 式 6. 3) ， 使 用 下 列 约束 来 减少 未 知 数 的 个 数 : 首先 , 令 Dal =1 


AX, ASAs; =0， 即 对 于 两 个 和 值 不 同 的 集群 ， 在 平稳 状态 下 请 求 不 会 从 到 达 
率 较 低 的 集群 分 派 到 较 高 的 集群 。 

最 优 分 派 率 A' 可 以 用 于 预测 一 个 集群 副本 系统 的 平均 请 求 服务 时 间 。 

命题 2: 最 优 分 派 率 所 对 应 的 请 求 服务 时 间 的 均值 由 式 (6.4) 给 出 : 
(A* + L)X (14 C) 
2[1- (A" - L) X] 


E[T]-A- X« +A-D (6.2) 


(6.3) 


E[T']-A' -X+ +A' - D (6.4) 


证 明 : 
使 用 式 (6.3) 得 到 的 最 优 分 派 率 ， 由 引 理 1 可 以 得 到 式 (6.4). 


6.6 ”数值 结果 


下 面 的 结果 将 显示 ， 广 域 重 定向 可 以 降低 客户 端 处 的 总 访问 延 时 。 相 比 于 服务 器 
负载 测量 误差 ， WARD 对 网 络 延 时 的 测量 精度 要 求 较 低 ， 这 就 进一步 验证 了 这 里 的 
假设 : 重 定向 机 制 必须 获得 更 精细 粒度 的 服务 器 负载 测量 值 ， 因 此 WARD 更 适用 于 
以 下 情况 : 运行 WARD 的 分 派 器 应 该 与 其 他 本 地 服务 器 同 地 协作 (co-located), H. 
通过 高 速 连接 与 远程 服务 器 通信 。 
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使 用 6.5 节 给 出 的 系统 模型 ， 考 虑 一 个 由 两 个 集群 构成 的 系统 ， 其 副本 具有 相同 的 
平均 请 求 服务 时 间 x。 进 而 ,假设 这 是 一 个 对 称 的 网 络 ， 其 中 两 个 集群 之 间 的 广 域 延 时 
A=A,, = Ayo 最 后 ， WA, =0, 即 满足 A, > À,—05 =0, 为 简单 起 见 表示 为 : A: =À 
Q&Q : =Q o 

基于 式 (6.2) ， 分 派 率 的 计算 公式 为 
aes +(1 -a +2(1 -a)A (6.5) 

根据 命题 1 可 以 求解 式 (6.5), ， 从 而 得 到 最 优 分 派 率 a" 。 从 现在 开始 , 将 1 -a* 
称 为 远程 重 定 向 率 ， 即 分 派 到 远程 处 理 的 请 求 的 比例 。 由 命题 2， 用 式 (65) 中 最 优 
比率 a' 替换 a 可 以 求 得 这 个 集群 系统 的 平均 总 延 时 。 

如 无 特殊 说 明 ， 本 节 使 用 以 下 默认 值 : x-242.9ms, a =40.1ms。 这 些 值 是 在 A it 
置 为 36ms 时 由 测试 平台 计算 得 到 的 ，A 相当 于 两 个 集群 之 间 在 纬度 453" 相 隔 6 个 时 区 的 
光速 延 时 ”。 这 里 使 用 p = 和 x 表示 所 有 集群 的 总 负载 。 对 于 那些 没有 重 定 向 的 集群 ，p 
相当 于 服务 器 在 瓶颈 层 的 负载 ， 因 此 WARD 可 以 将 负载 分 派 到 本 地 集群 和 远程 集群 上 。 
为 了 得 到 p 的 一 个 给 定 值 ， 可 以 将 x 保持 固定 不 变 ， 而 调节 到 达 率 和 的 取 值 。 


6.6.1 广 域 重 定向 下 的 结果 


首先 证 明 广 域 重 定向 可 以 降低 用 户 感知 到 的 总 延 时 。 使 用 式 (6.3) MA (6.4) 
计算 WARD 的 总 延 时 ， 并 将 其 与 不 采用 重 定向 的 集群 的 总 延 时 进行 比较 。 从 图 6. 4 
可 以 看 到 ， 总 延 时 是 端 对 端 延 时 和 不 同 的 系统 负载 p 的 函数 。 


E[T] =ax+ 


=- WARD (=0.5 
o- LREN 05) 


*- JG RE [8 (2-09) 


总 延 时 /s 





0 50 100 150 200 250 
端 对 端 延 时 A/ms 
图 6.4 使 用 和 不 使 用 广 域 重 定向 时 总 延 时 的 比较 
在 低 负载 (p =0.5) 的 情况 下 ， 只 有 在 端 对 端 延 时 A<25ms 时 总 负载 才 会 有 所 降 
低 ; 对 于 较 高 的 延 时 ， 重 定向 开销 超过 了 处 理 的 时 间 ， 此 时 所 有 的 请 求 将 在 本 地 处 理 。 


日 、 设 地 球 在 纬度 为 45° 处 的 圆周 长 度 为 28 335km， 且 光 在 光纤 中 的 速度 为 205km/s， 则 横 跟 1 个 时 区 
的 单程 延 时 为 28 335/ (205 x24) =6ms。 一 一 原 书 注 
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不 过 ， 当 负载 较 高 时 总 延 时 可 以 得 到 显著 的 降低 。 在 一 个 中 间 水 平 的 负载 p =0.75 以 及 
A <50ms 的 情况 下 ， 使 用 WARD 可 以 使 总 延 时 从 0. 16s 降低 到 0. 13s， 降 低 了 18% 。 对 
于 一 个 负载 很 大 的 系统 (p =0.9 RA <50ms) ， 如 果 不 采 用 重 定向 ， 总 延 时 为 0.38s， 而 
采用 WARD 时 总 延 时 可 以 降低 到 0. 15s, RT 60% 。 当 负载 p 超过 0.9 时 ， 相 信 该 模 
型 能 够 更 大 幅度 地 降低 延 时 。 


6.6.2 ”对 测量 误差 的 敏感 度 


下 面 将 证 明 只 有 在 服务 器 利用 率 采 用 一 个 非常 精细 的 测量 粒度 时 才能 获得 性 能 上 
的 收益 。 与 之 形成 对 照 的 是 ， 网 络 延 时 的 测量 粒度 即使 较 大 也 不 会 产生 不 利 的 影响 。 
为 了 证 明 这 一 点 ， 这 里 研究 了 网 络 延 时 A 和 服务 器 负载 p 的 测量 误差 对 性 能 的 影响 。 
在 进行 分 析 时 ， 采 用 误差 容忍 度 这 个 指标 来 量化 对 性 能 的 影响 。 误 差 容忍 度 定义 为 对 
总 延 时 的 影响 最 大 不 超过 2% 的 百分比 误差 上 e。 

首先 研究 网 络 延 时 的 测量 误差 对 性 能 的 影响 。 令 4 表示 实际 的 集群 间 网 络 延 时 ， 
A =A +6 表示 其 测量 值 ，D 表示 相应 的 往返 时 间 和 矩阵 。 分 派 器 计算 分 派 率 时 ， 用 D 替 
Hest (6.2) 中 的 DD。 

利用 式 (6.4) 计算 总 延 时 的 平均 值 时 ， 将 使 用 实际 的 网 络 延 时 D。 网 络 延 时 的 
测量 误差 对 远程 重 定向 率 (1 -a) 及 相应 的 平均 请 求 响应 时 间 的 影响 如 图 6.5 所 示 。 
”每 条 曲线 表示 一 个 不 同 的 (真实 的 ) 延 时 A, x 轴 表 示 误 差 6 (为 4A 的 百分比 )。 

从 图 6. 5a 中 可 以 看 出 ，5 为 负 时 ， 重 定向 率 的 变化 幅度 比 相应 的 正 值 处 要 大 。 产 
生 这 种 现象 的 原因 是 ， 重 定向 率 并 不 随 端 对 端 延 时 而 线性 增长 。 非 对 称 性 的 一 个 表现 
是 ， 总 延 时 在 5 为 负 时 增长 的 更 多 ， 如 图 6. 5b 所 示 。 不 过 ， 需 要 注意 的 是 ， 响 应 时 
间 对 延 时 测量 误差 并 不 是 很 敏感 ， 误 差 容忍 度 在 +20% 之 间 相 当 高 。 























0.05 0.20 L5——9—— —n—a—&—n2—2— —:—e—;——^2 
-80 -60 -40 -20 0 20 40 60 80 -80 -60 -40 -20 0 20 40 60 80 
测量 误差 5 (%) 测量 误差 5 (%) 
a) b) 


图 6.5 在 网 络 测量 误差 下 的 WARD 性 能 (x 轴 上 的 0 点 表示 没有 测量 误差 的 理想 情况 ， 
服务 器 负载 设置 为 p=0. 95) 
a) 远程 重 定向 率 b) 总 延 时 
类 似 地 ， 可 以 研究 服务 器 负载 测量 不 精确 ( 如 源 自 接收 测量 数据 时 的 延 时 ) 的 
情况 。 这 种 情况 下 ,分派 器 测量 到 的 负载 为 p= 和 Ax， 其 中 入 = 和 +s Ce 取 值 为 正确 负 
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a a 
载 p 的 百分比 ) ,测量 到 的 相应 到 达 率 为 上 上， 网 络 延 时 设置 为 A = 500ms。 

首先 分 析 测 量 误差 a >0 的 情况 。 这 时 ， 分 派 器 假定 服务 器 负载 比 其 实际 值 高 ， 

从 而 进行 重 定向 的 请 求 比 最 优 值 要 多 。 从 图 6. 6a 可 以 发 现 ， 远 程 重 定向 率 随 测量 误 

差 的 增 大 而 增 大 。 这 些 人 额外 的 重 定向 带 来 了 更 多 的 网 络 延 时 ， 且 总 延 时 随 之 线性 增 
加 ， 如 图 6. 6b 所 示 。 特 别 地 ， 当 p>=0. 9 时， 误差 的 容忍 度 为 +1.5% 。 


远程 重 定向 率 (1-Q) 





ET -15 -10 =5 0 5 
测量 误差 =(%) 测量 误差 <(%) 
a) b) 


图 6.6 服务 器 负载 测量 误差 与 WARD 性 能 的 关系 
a) 远程 重 定向 率 b) 总 延 时 

X HRM, 分派 器 假定 本 地 服务 器 负载 小 于 实际 值 。 这 时 ， 重 定向 数量 减少 ， 
本 地 服务 器 的 负载 给 本 地 集群 带 来 了 更 长 的 处 理 时 间 。 正 如 预期 的 那样 ， 图 6. 6b 显 
示 ， 在 服务 器 运行 于 高 负载 时 (p=>0.9) ， 总 延 时 对 负 的 e 敏感 得 多 ， 这 时 误差 容忍 
度 只 有 -0.5% 。 

对 延 时 测量 误差 和 服务 器 负载 测量 误差 造成 的 影响 进行 比较 可 知 ， 对 延 时 误差 的 
误差 容忍 度 为 +20% ， 而 对 服务 器 负载 的 误差 容忍 度 则 低 一 个 数量 级 ， 为 +1.5% 和 
-0.5% 。 从 中 可 以 得 出 结论 : 服务 器 负载 比 网 络 延 时 需要 更 高 的 测量 精度 。 

对 于 服务 器 端 重 定向 机 制 来 说 ， 由 于 它 能 够 在 较 低 的 开销 下 得 到 更 精确 的 服务 器 
负载 信息 ， 所 以 自然 可 以 更 有 效 地 实现 请 求 的 均衡 。 首 先 ， 运 行 在 客户 端 或 DNS 服 
务 器 的 客户 端 重 定向 策略 也 许 不 能 使 用 服务 器 的 高 带宽 连接 ; 其次， 运行 在 接近 客户 
端的 代理 服务 器 (如 Akamai) 上 的 客户 端 重 定向 也 许 能 使 用 高 带宽 的 访问 连接 , 但 
客户 端 需要 配备 比 服务 器 端 更 多 的 分 派 器 ， 这 使 得 获取 服务 器 负载 信息 的 开销 要 大 得 
多 。 设 集群 的 数量 为 >， 即 WARD PA n 个 服务 器 端 分 派 器 ， 如 果 在 运行 WARD 的 
那个 层 中 ， 所 有 集群 的 服务 器 总 数 为 M(M>n), ABA WARD 中 交换 信息 的 复杂 度 是 
0(nM) 。 与 之 相 比 ， 设 每 个 客户 端 附近 的 代理 服务 器 具有 一 个 分 派 器 ， 那 么 总 共有 
个 代理 服务 器 或 分 派 器 的 客户 端 重 定向 机 制 的 交换 信息 复杂 度 为 0( NM) 。 假 定 在 典 
型 情况 下 客户 端 代 理 服务 器 数量 远大 于 集群 副本 的 数量 ， 则 服务 器 端 重 定向 机 制 的 复 
杂 度 要 小 得 多 。 这 一 点 可 以 通过 下 面 的 例子 证 明 : 假设 在 一 个 客户 端 重 定向 方法 中 ， 
每 个 自治 系统 中 安装 一 个 代理 服务 器 ， 则 的 数量 估计 为 39 000 左右 ， 相 比 而 言 ， 
一 个 典型 的 集群 网 格 包含 大 约 60 个 集群 ， 而 60 << 39 000。 
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6.7 测试 平台 的 实现 及 实验 


本 节 介 绍 一 个 CDN 原型 的 实现 ， 通 过 实验 将 使 用 WARD 的 广 域 重 定向 与 其 他 的 
重 定向 策略 进行 比较 。 实 验 结果 为 广 域 集 群 驱动 的 重 定 向 和 平台 关键 性 能 因子 实验 提 
供 了 一 个 概念 验证 的 展示 ， 并 验证 这 个 性 能 模型 。 

如 图 6. 1 所 示 ， 测 试 平台 由 一 个 集群 构成 ， 该 集群 中 每 台 计 算 机 的 配置 为 : Intel 
Pentium IV 2. 0 GHz 处 理 器 、 操 作 系统 为 Linux 2. 4. 18 -14、512 MB SDRAM 内 存 和 一 
个 30GB ATA -66 硬盘 。 集 群 中 的 一 台 计 算 机 作为 一 个 路 由 器 ， 运 行 Nistnet?  ( 即 一 
个 IPlayer 网 络 仿真 软件 包 ) ， 这 台 路 由 器 将 其 他 计算 机 分 为 三 个 域 : 客户 端 和 两 个 集 
群 。 这 一 配置 可 以 生成 客户 端 和 集群 之 间 及 集群 和 集群 之 间 的 网 络 条 件 ( 延 时 和 带 
$E) 的 不 同 组 合 。 这 里 提出 的 一 个 三 层 系 统 架构 如 图 6. 2 所 示 ， 其 中 Web 层 使 用 了 
一 个 Apache Web 服务 器 5 ， 在 应 用 层 中 动态 内 容 使 用 PHP 脚本 提供 ";， 使 用 一 个 
MySQL 服务 器 实现 对 一 个 容量 为 4GB 的 数据 库 进行 访问 "1 。 


6.7.1 数据 库 分 派 器 


上 述 集群 架构 的 一 个 关键 部 分 是 分 派 器 ， 它 负责 决定 是 否 对 一 个 本 地 或 远程 的 请 
求 进行 服务 。 在 这 里 的 测试 平台 中 ， 由 于 复杂 的 数据 库 操作 所 带 来 的 大 量 处 理 需 要 ， 
使 数据 库 层 在 最 初 阶段 就 成 了 瓶颈 ， 因 此 在 数据 库 前 端 配置 了 分 派 器 用 于 远程 重 定 
向 。 在 我 们 的 实现 中 ， 提 供 了 Web 层 和 应 用 层 ， 并 为 其 配备 充分 的 资源 ， 以 便 使 数 
据 库 层 确实 成 为 一 个 瓶颈 。 

因为 数据 库 分 派 器 的 目标 是 使 查询 的 响应 时 间 最 小 化 ， 所 以 它 的 分 派 能 力 受 到 一 致 
性 约束 的 限制 。 分 派 器 使 用 两 种 方式 解决 一 致 性 问题 : 一 是 对 所 有 的 数据 库 服务 器 保持 
写 操作 的 统一 有 序 ; 二 是 “一 读 全 写 ” 的 分 派 策 略 。 为 了 保持 对 所 有 写 操作 统一 有 序 ， 
每 一 个 写 操作 被 分 配 一 个 唯一 的 序列 号 ， 数 据 库 服务 器 按照 序列 号 的 顺序 处 理 写 操作 。 
在 “一 读 全 写 ” 分 派 策 略 中 ， 写 操作 被 发 送 到 所 有 的 数据 库 ， 一 旦 其 中 有 一 个 服务 器 
完成 了 该 操作 ， 响 应 就 返回 ， 因 此 数据 库 一 致 性 的 维护 是 异步 的 。 如 果 是 一 个 读 操作 ， 
则 将 其 有 选择 地 发 到 一 台数 据 库 服务 器 上 ， 服 务 器 的 选择 依据 是 ， 该 服务 器 上 相应 的 冲 
突 写 操作 已 通过 一 个 称 为 冲突 检测 … 的 调度 策略 进行 了 处 理 。 这 种 异步 维护 的 一 致 性 
和 冲突 检测 机 制 相 对 于 同步 一 致 性 算法 ， 表 现 出 了 更 高 的 吞吐 量 。 

不 过 ， 虽 然 冲突 检测 调度 使 这 组 服务 器 对 读 操作 不 能 进行 大 范围 内 的 分 派 ， 但 两 
个 因素 的 存在 使 我 们 可 以 忽略 这 个 局 限 : 一 是 对 读 操 作 的 服务 时 间 长 于 写 操作 ; 二 是 
电子 商务 中 读 的 比重 非常 大 … 。 

WARD 允许 使 用 一 个 一 般 的 框架 在 任意 层 实现 远程 重 定向 。 虽 然 这 里 将 其 实现 
在 数据 库 层 的 前 端 ， 但 它 也 可 以 完全 等 效 地 实现 在 Web 层 或 应 用 层 的 前 端 ， 这 时 可 
以 重 定向 整个 请 求 〈 而 不 是 一 组 数据 库 查询 )。 请 求 重 定向 可 以 降低 网 络 开 销 ,但 它 
同时 也 会 将 数据 库 操作 限制 到 本 地 数据 库 服务 器 ， 因 此 就 不 能 获得 将 数据 库 操作 进行 
远程 重 定 向 所 带 来 的 好 处 。 本 章 不 对 请 求 重 定向 和 数据 库 操作 重 定向 进行 对 比 ， 而 是 
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将 注意 力 集中 在 一 般 意义 上 远程 重 定向 对 性 能 产生 的 提高 。 
6.7.2 重 定向 算法 


在 一 致 性 约束 下 ， 数据库 分 派 器 将 读 操 作 定向 到 具有 最 小 平均 响应 时 间 的 数据 库 
服务 器 上 。 首 先 ， 在 所 有 的 集群 中 使 用 冲突 检测 调度 ， 那 些 未 处 理 写 冲突 的 集群 被 排 
除 。 然 后 ， 在 剩 下 的 集群 中 ， 分 派 器 使 用 每 请 求 或 概率 重 定向 策略 选择 一 个 集群 。 在 
每 请 求 策略 中 ,分 派 器 使 用 数据 库 层 负载 的 测量 值 计算 平均 响应 时 间 ， 并 确定 服务 器 
处 理 时 间 的 节省 是 否 大 于 分 派 导致 的 延 时 。 在 概率 策略 中 ， 分 派 器 使 用 根据 模型 计算 
出 的 最 优 重 定向 率 ， 并 按照 此 概率 分 派 请 求 。 通 过 实现 这 个 概率 策略 ， 使 得 对 于 给 定 
的 若干 客户 端 ， 使 用 模型 预测 的 重 定向 率 进行 配置 ， 就 可 以 不 必 在 线 测量 服务 器 的 
负载 。 


6.7.3 TPC-W 工作 负载 


对 于 工作 负载 ， 实 验 中 采用 TPC - W 基准 "生成 一 个 电子 商务 的 工作 负载 ， 用 其 
模拟 一 个 在 线 书店 网 站 。 这 里 使 用 由 Amza 等 人 开发 的 针对 冲突 检测 调度 和 动态 内 容 
应 用 的 策略 "1。 | 

TPC - W 的 工作 负载 用 一 个 客户 端 仿真 器 产生 。 仿 真 器 生成 TPC -W 浏览 操作 集 
合 中 规定 的 请 求 ， 包 含 95% 的 读 操 作 和 5% 的 写 操作 。 这 个 客户 端 仿真 器 启动 n 个 用 
户 会 话 ， 延 续 时 间 为 15min。 每 一 个 会 话 与 Web 服务 器 建立 一 个 永久 的 HTTP 连接 ， 
并 发 送 一 个 请 求 序 列 到 集群 。 在 两 个 请 求 之 间 ， 用 户 在 发 出 下 一 个 请 求 之 前 的 等 待 时 
间 是 一 个 可 配置 的 参数 ， 称 为 思考 时 间 (think time) 。 思 考 时 间 的 平均 值 (这 里 设 为 
7s) 和 用 户 数 可 以 用 来 定义 集群 的 请 求 到 达 率 。 这 里 需要 注意 的 是 ， 一 个 PHP 脚本 
可 能 包含 很 多 个 对 数据 库 的 操作 。 操 作 的 提取 和 序列 化 执行 由 应 用 层 执 行 。 由 于 每 个 
请 求 包含 了 若干 个 内 和 骨 的 数据 库 操 作 ， 它 们 到 达 数 据 库 的 时 间 分 布 和 到 达 率 与 由 客户 
端 仿真 器 产生 的 情形 是 不 同 的 。 


6.7.4 实验 


在 实验 中 ， 输 入 参数 包括 集群 间 连 接 延 时 (通过 Nistnet 模块 来 调整 ) 和 到 达 每 
个 集群 的 客户 端 数量 。 测 量 的 参数 包括 客户 端 测量 到 的 请 求 响应 时 间 、 数 据 库 分 派 器 
测量 到 的 数据 库 请 求 响应 时 间 和 远程 重 定向 率 。 请 求 响应 时 间 定 义 为 一 个 请 求 从 产生 
到 客户 端 收 到 响应 的 最 后 一 个 字 节 之 间 的 时 间 。 数 据 库 请 求 响应 时 间 定 义 为 分 派 器 向 
数据 库 发 出 一 个 请 求 到 分 派 器 接收 到 响应 之 间 的 时 间 。 对 于 实验 过 程 中 产生 的 所 有 请 
求 ， 计 算 响应 时 间 的 均值 及 其 第 90 百 分 位 数 。 远 程 重 定向 率 定义 为 分 派 器 转发 到 远 
程 数据 库 服务 器 的 请 求 数 占 总 请 求 数 的 比例 。 

首先 ， 使 用 离线 技术 根据 数据 库 请 求 响应 时 间 的 特性 对 每 请 求 重 定向 策略 进行 配 
置 ， 其次， 在 本 地 数据 库 服务 器 的 负载 与 广 域 连接 延 时 之 间 寻 求 一 个 折 中 ， 从 而 量化 
WARD 架构 在 性 能 上 的 收益 ; 第 三 ， 根 据 测试 平台 获得 的 测量 值 ， 使 用 6. 5 节 中 的 解 
析 模 型 计算 性 能 的 收益 ， 并 与 实际 情况 进行 比较 。 


136 内 容 分 发 网 络 








1. 查询 响应 时 间 特 性 的 离线 测量 

在 实验 中 ， 将 响应 时 间作 为 CPU 负载 的 一 个 函数 进行 测量 ， 对 于 每 请 求 重 定向 策 
略 来 说 这 是 一 个 关键 性 的 输入 条 件 。 实 验 中 使 用 的 每 个 集群 可 以 访问 一 个 本 地 数据 库 服 
务 器 。 一 个 数据 库 请 求 的 执行 时 间 取 决 于 同时 运行 在 数据 库 服务 器 上 的 其 他 请 求 的 数量 
和 类 别 ， 这 可 以 被 抽象 为 进入 系统 的 工作 负载 ， 从 而 可 以 通过 增加 客户 端的 数量 来 改变 
数据 库 服务 器 的 CPU 负载 。 在 每 个 情况 下 ， 对 每 组 (30 个 ) MySQL 只 读 请 求 测量 其 平 
均 执 行 时 间 ， 得 到 的 延 时 一 负载 关系 曲线 (DLE 6.7) 将 被 用 于 每 请 求 重 定向 策略 。 


平均 查询 响应 时 间 /s 








010 2 30 40 50 60 70 80 90 100 
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图 6.7 平均 查询 响应 时 间 和 数据 库 服 务 器 的 平均 CPU 负载 
(使 用 TPC - W 基准 的 浏览 集中 30 个 只 读 的 MySQL 请 求 ) 
2. WARD 性 能 收益 
WARD 可 以 结合 服务 器 负载 和 网 络 延 时 执行 一 个 每 请 求 重 定向 。 利 用 这 里 的 实 
验 测试 平台 ， 首 先 验证 WARD 在 改善 集群 性 能 方面 的 功效 。 实 验 中 ， 为 本 地 集群 的 
Web 层 配备 充足 的 服务 器 ， 使 其 不 再 成 为 瓶颈 。 本 地 和 远程 集群 的 数据 库 层 都 有 一 
个 服务 器 ， 请 求 只 到 达 本 地 集群 ， 在 其 Web 层 处 理 完 后 ， 其 中 对 数据 库 的 请 求 或 者 
在 本 地 数据 库 层 处 理 ， 或 者 重 定 向 到 远程 的 数据 库 层 。 
这 里 将 WARD 的 性 能 与 下 述 4 种 不 同 的 strawman 算法 进行 比较 : 中 无 重 定向 ， 即 
本 地 处 理 所 有 的 查询 ; @) 只 考虑 延 时 ， 即 根据 最 近 一 次 测量 的 结果 ， 将 请 求 转发 到 往返 
时 间 最 小 的 那 台 服务 器 上 ; @ 只 考虑 服务 器 ， 即 数据 库 请 求 被 转发 到 CPU 负载 最 小 、 
被 认为 处 理 最 快 的 服务 器 上 ; @ 轮 转 ， 即 使 用 轮转 方式 在 本 地 和 远程 数据 库 服 务 器 之 间 
转发 请 求 。 后 三 种 涉及 数据 库 请 求 整 体重 定向 的 算法 被 称 为 重 定 向 strawman 算法 。 
实验 中 ，TPC -W 包含 100 个 客户 端 会 话 ， 每 个 会 话 的 平均 请 求 到 达 间 隔 时 间 为 
4s， 得 到 的 性 能 如 图 6.8 所 示 。 首 先 ， 从 图 6. 8a 中 可 以 看 出 ， 所 有 将 请 求 从 本 地 服 
务 器 重 定向 到 远程 服务 器 的 算法 ， 其 性 能 都 优 于 无 重 定 向 的 算法 。 这 就 重申 了 以 下 事 
实 : 对 于 这 种 程度 的 工作 负载 ， 本 地 数据 库 服务 器 负担 很 重 ， 所 以 将 其 一 部 分 负载 重 
定向 到 远程 服务 器 会 取得 更 好 的 效果 。 不 过 ，WARD 的 性 能 比 所 有 的 strawman 算法 
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都 要 好 得 多 ， 这 就 证 明了 其 优越 性 。 实 际 上 ， 如 图 6. 8b 所 示 ，WARD 的 性 能 较 高 ， 
因而 数据 库 请 求 被 重 定向 到 远程 服务 器 的 比例 就 最 低 。 产 生 这 个 现象 的 原因 在 于 
WARD 采用 了 更 好 的 基于 每 请 求 策略 的 重 定向 方法 ， 而 每 请 求 策略 的 优势 是 综合 考 
虑 了 服务 器 负载 和 延 时 这 两 方面 的 因素 。 


平均 响应 时 间 /s 
重 定向 请 求 的 部 分 





0 — 30 100 150 200 250 300 350 400 "FON B REPRE EPA Eh 
端 对 端 延 时 /ms 端 对 端 延 时 /ms 
a) b) 
图 6.8 WARD 与 无 重 定向 、 仅 延 时 、 仅 服务 器 和 
轮转 等 strawman 算法 的 性 能 比较 
a) 响应 时 间 b) 重 定向 率 

其 次 ， 只 考虑 延 时 的 算法 在 所 有 的 strawman 重 定向 算法 中 性 能 最 差 。 这 个 结果 
进一步 验证 了 这 里 的 假设 : 对 于 一 个 动态 内 容 网 站 (如 实验 中 的 这 个 模拟 环境 ) ， 在 
进行 转发 决策 时 服务 器 负载 的 影响 比 延 时 更 重要 。 不 过 ， 当 集群 间 延 时 增 大 时 ， 只 考 
虑 服务 器 负载 的 算法 在 性 能 上 也 变 得 比 WARD 更 差 了 。 这 也 是 一 个 意料 中 的 结果 ， 
因为 只 考虑 服务 器 负载 的 算法 并 不 将 延 时 因素 结合 到 其 重 定 向 决策 中 ， 因 此 就 不 能 为 
每 个 请 求 做 出 正确 的 重 定向 决策 。 相 反 ，WARD 在 进行 重 定向 决策 时 ， 从 设计 上 就 
综合 考虑 到 服务 器 负载 和 延 时 。 

第 三 ， 所 有 重 定向 算法 (WARD 和 strawman 算法 ) 的 性 能 都 会 随 着 集群 间 延 时 
的 增 大 而 下 降 ， 其 原因 在 于 重 定向 的 延 时 开销 变 得 更 高 了 。 最 终 ， 即 使 单条 数据 库 请 
求 的 重 定 向 开销 也 可 能 会 超过 一 台 低 CPU 负载 的 远程 服务 器 的 收益 。 因 此 , — H3 
对 端 延 时 高 达 270 (375) ms， 只 考虑 延 时 的 算法 (轮转 算法 ) 甚至 比 无 重 定向 算法 
还 要 差 。 相 比 所 有 的 strawman 算法 而 言 ，WARD 可 以 支持 更 远 的 远程 集群 。 

3. 模型 的 验证 和 重 定向 策略 

为 了 验证 6. 5 节 提 出 的 解析 模型 ， 在 这 里 的 测试 平台 上 将 其 与 WARD 重 定向 策 
略 进行 了 比较 。 因 为 瓶颈 在 数据 库 层 ， 所 以 这 里 将 该 模型 下 数据 库 层 处 理 请 求 的 重 定 
向 率 和 响应 时 间 与 测试 平台 进行 了 比较 。 对 于 该 模型 ， 这 里 使 用 了 6.6 节 中 的 式 
(6.5) ， 参 数 设 置 为 X=42. 9ms, o =40. 1ms， 这 与 测试 平台 上 在 未 加 载 的 数据 库 服务 
器 上 测量 到 的 结果 相同 。 

首先 ， 图 6.9 中 将 模型 与 单 集群 中 实际 的 平均 请 求 响应 时 间 (服务 器 负载 p 的 函 
数 ) 进行 了 比较 。 从 中 可 以 发 现 ， 当 服务 器 负载 p <0.7 时 ， 模型 与 实际 测量 到 的 响 
应 时 间 的 符合 度 差异 在 +10% 以 内 。 服 务 器 负载 p 超过 0. 7 时 ， 模 型 的 结果 与 实际 结 
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数据 库 服务 器 总 负载 ”2 (本 地 + 远程 ) 
图 6.9 WARD 解析 模型 (HARRE) 
果 存 在 较 大 差异 ， 这 是 由 于 : OR BW WC/1 模型 是 基于 一 个 简单 的 假设 ， 即 服务 
器 层 每 个 请 求 的 响应 返回 过 程 相 互 独立 ， 这 个 假设 可 能 与 实际 情况 相悖 ， 例 如 由 同一 
条 Web 请 求 所 派生 出 的 若干 数据 库 请 求 之 间 存 在 着 相关 性 ; @ 这 里 的 M/G/1 模型 没 
有 考虑 到 读 一 写 冲 突 ， 当 存在 冲突 时 数据 库 请 求 的 处 理 时 间 可 能 会 比 模型 预计 的 时 间 
Kk; @ 在 高 负载 情况 下 ， 会 存在 更 多 的 数据 库 请 求 ， 并 由 此 出 现 更 多 的 冲突 。 
其 次 ， 对 模型 实现 重 定 向 的 概率 策略 和 每 请 求 策略 进行 了 比较 。 在 所 有 实验 中 集 
群 间 延 时 设 为 25ms ， 采 用 每 请 求 策略 时 每 隔 5s 接收 一 次 CPU 负载 的 测量 值 。 
在 图 6. 10 中 比较 了 远程 重 定 向 率 和 请 求 响应 时 间 与 系统 负载 的 关系 。 模 型 的 重 定 
向 率 与 概率 策略 关系 紧密 ， 因 为 该 策略 基于 模型 预测 的 最 优 值 。 另 外 ， 相 比 于 这 里 的 模 
型 和 概率 策略 ， 每 请 求 策略 在 p «0.5 时 可 以 更 早 地 启动 重 定向 ， 从 而 被 重 定向 的 请 求 
也 更 多 。 出 现 这 种 情况 的 原因 在 于 ， 请 求 量 很 大 时 会 对 系统 负载 比较 敏感 ， 如 图 6. 10a 
所 示 。 由 此 ， 有 必要 在 系统 负载 相对 较 低 的 时 候 就 启动 请 求 的 重 定向 。 因 此 ， 每 请 求 策 
略 在 o <0.5 时 表现 出 较 好 的 性 能 , 平均 响应 时 间 较 低 ， 如 图 6. 10b 所 示 。 
0.50 
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图 6.10 WARD 解析 模型 的 验证 
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当 p >0.5 时 ， 概 率 策 略 重 定 向 请 求 的 数量 比 每 请 求 策略 多 ， 也 就 产生 了 更 低 的 响应 
时 间 。 这 种 差异 的 原因 是 ，5s 的 采样 间隔 造成 时 间 粒 度 过 粗 ， 以 至 于 不 能 捕获 CPU 
负载 的 小 波动 。 采 样 间隔 小 一 点 应 该 可 以 得 到 更 好 的 响应 时 间 ， 但 这 就 要 求 在 精度 和 
测量 开销 上 寻求 一 个 最 优 的 折 中 。 
这 样 ， 从 实验 中 得 出 了 两 个 重要 的 结论 : 第 一 ， 尽 管 MWC/ 模型 非常 简化 ,但 
它 的 确 与 实际 情况 匹配 得 很 好 ， 所 以 6.6 节 中 的 模型 得 出 的 结论 应 该 可 以 认为 与 真实 
世界 的 情况 相 吻 合 ; 第 二 ，WARD 的 每 请 求 重 定向 算法 与 概率 算法 相 比 ， 在 低 负载 
的 条 件 下 效果 更 好 ， 而 在 高 负载 情况 下 可 以 通过 减 小 采样 间隔 来 改善 其 性 能 。 


6.8 写 给 使 用 者 


首先 ， 本 章 强调 了 请 求 重 定向 对 CDN 资源 多 路 复 用 和 Web 用 户 响应 时 间 的 重要 
性 。 基 于 此 ， 本 章 研究 了 一 个 被 世界 各 地 用 户 访问 的 Web 应 用 。 资 料 显示 ，Web 应 
用 具有 “每 日 时 段 ” 的 流量 特点 ， 即 白天 工作 时 间 的 流量 比 晚上 高 。 假 设 客户 端 重 
定向 机 制 的 主要 目标 是 将 用 户 重 定向 到 最 “ 近 ” 的 服务 器 集群 ， 那么 可 以 认为 某 个 
特定 的 集群 在 白天 时 间 具 有 较 高 的 流量 。 如 果 由 CDN 管理 的 一 个 应 用 使 用 了 跨越 欧 
洲 和 北美 的 两 个 集群 ， 那 么 由 于 它们 之 间 时 间 的 差异 ， 多 路 复 用 可 以 明显 实现 资源 的 
节省 。 如 果 流 量 在 美国 的 白天 超过 了 正常 水 平 ， 一 个 广 域 重 定向 机 制 能 够 将 请 求 从 过 
载 的 集群 (位 于 美国 ) 重 定向 到 暂时 未 过 载 的 集群 (位 于 欧洲 ) ， 所 以 广 域 重 定向 机 
制 可 以 做 到 资源 的 多 路 并 行 复 用 。 既 然 位 于 美国 和 欧洲 的 集群 可 以 利用 这 个 机 制 获得 
类 似 的 性 能 ， 那 就 都 不 需要 过 多 地 配备 其 资源 ， 从 而 实现 资源 的 节省 。 

第 二 个 结论 是 提供 每 请 求 重 定向 或 服务 器 选择 机 制 的 重要 性 ， 这 些 机 制 可 以 将 服 
务 器 负载 和 网 络 延 时 综合 考虑 。 基 于 此 ， 在 6. 6. 2 节 中 强调 了 服务 器 端 重 定向 机 制 能 
够 在 较 低 的 负载 下 以 精细 粒度 测量 服务 器 的 负载 。 这 就 重申 了 一 个 重要 的 发 现 : 相 比 
于 客户 端 重 定向 ， 一 个 服务 器 端 重 定 向 机 制 可 以 在 较 低 的 测量 开销 下 取得 较 高 的 性 能 
(如 Akamai 中 的 DNS 重 定向 ) o 


6.9 未 来 研究 方向 


本 章 探讨 了 通过 使 用 一 个 请 求 重 定向 机 制 获得 的 性 能 提升 ， 并 为 动态 内 容 设计 了 
一 个 请 求 重 定向 算法 。 因 为 数据 库 层 被 认为 是 瓶颈 所 在 ， 所 以 将 这 个 重 定向 算法 在 数 
据 库 层 进行 了 验证 。 | 

将 来 一 个 值得 关注 的 研究 方向 可 能 是 将 重 定向 机 制 应 用 到 集群 的 其 他 几 个 导 
(如 Web 层 或 应 用 层 ) ， 以 期 获得 性 能 的 进一步 提高 。 在 处 理 一 个 客户 端 请 求 时 ， 应 
用 层 向 数据 库 层 发 出 若干 条 数据 库 请 求 ， 数 据 库 层 执行 的 重 定向 操作 把 所 有 这 些 数据 
库 请 求 分 派 到 位 于 一 个 远程 集群 的 数据 库 服务 器 上 。 在 这 种 情况 下 ， 每 一 个 数据 库 请 
求 都 要 承受 网 络 的 往返 延 时 ， 而 如 果 将 该 客户 端 请 求 而 不 是 那些 派生 出 的 数据 库 
请 求 ) 分 派 到 一 个 远程 集群 的 Web 服务 器 上 ， 这 些 延 时 就 可 以 避免 了 。 
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6.10 结论 


本 章 提出 的 请 求 重 定向 技术 ， 不 仅 可 以 降低 用 户 端 响应 时 间 ， 还 可 以 从 整体 上 实 
现 集群 之 间 资 源 的 多 路 复 用 。 特 别 地 ， 本 章 为 动态 内 容 开 发 了 一 个 概念 验证 性 的 请 求 
重 定向 机 制 ( 即 WARD), ， 用 来 强调 相应 的 设计 原则 。WARD 的 目标 是 通过 综合 考虑 
网 络 和 服务 器 的 延 时 来 使 处 理 动态 内 容 请 求 时 端 到 端的 延 时 最 小 化 。 本 章 设 计 了 一 个 
解析 模型 以 及 用 于 概念 验证 的 具体 实现 ， 以 展示 平均 请 求 响应 时 间 的 显著 降低 。 例 
如 ， 对 于 托管 一 个 电子 商务 网 站 并 处 理 300 个 并 发 用 户 的 CDN，WARD 可 以 将 平均 响 
应 时 间 从 5s 缩短 到 2. 3s， 降 幅 达 54% 。 不 仅 如 此 ， 模 型 预测 : 当 Web 请 求 中 动态 内 
容 处 理 的 复杂 性 增 大 时 性 能 也 会 进一步 提高 。WARD 尤其 适合 于 避免 由 于 短期 瓶颈 
(如 瞬时 拥塞 ) 造成 的 响应 时 间 的 增 大 。 如 果 重 定向 的 延 时 开销 不 是 过 高 ，WARD 也 
可 以 利用 大 时 间 尺 度 下 的 趋势 (如 由 每 日 时 段 效应 造成 的 工作 负载 变化 ) ， 由 此 就 可 
以 避免 对 Web 集群 提供 昂贵 的 过 度 配 置 。 最 后 ，WARD 是 一 个 服务 器 端的 重 定向 ， 
这 个 解决 方案 与 内 容 复制 、 客 户 端 重 定向 和 服务 器 迁移 策略 互 不 影响 ， 这 就 使 得 它 可 
以 与 这 些 方法 实现 无 颖 的 集成 。 


附录 


这 里 提供 引 理 1 的 一 个 证 明 。 
证 明 : 
总 服务 时 间 由 三 部 分 组 成 : 
1) 请 求 在 分 派 器 和 远程 集群 之 间 传输 的 网 络 延 时 ; 
2) 在 集群 上 的 排队 时 间 ; 
3) 集群 的 服务 时 间 。 
根据 对 称 性 ， 在 下 面 的 公式 中 将 时 间 开 销 归于 接收 请 求 的 集群 i。 首 先 ， 假设 分 
派 器 与 本 地 集群 之 间 的 网 络 延 时 As =0， 那 么 网 络 延 时 就 只 产生 在 请 求 转发 给 远程 集 
群 的 过 程 中 : 
ar; (Aj +A;) (6. 6) 
其 次 ,考虑 请 求 在 集群 队列 中 等 待 处 理 的 平均 等 待 时 间 。 通 常 一 个 M/G/1 队列 
的 等 待 时间 为 
(l +e 
E n 
AF, p=Ax。 
对 于 任何 一 个 集群 i;， 到 达 率 A 是 从 所 有 的 集群 /分派 到 集群 二 的 请 求 的 和 ， 即 
A; = 之 jajiAjo 使 用 该 入 ， 式 (6.7) 可 以 针对 单个 集群 i 改写 为 
(E,a,a,) 8 (1 +62) 
3D -(X AURI (6. 8) 
RA, REE i 对 一 个 请 求 的 服务 时 间 为 
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CQ (6.9) 
对 于 一 组 集群 ， 这 三 项 的 和 可 得 式 (6.2), 
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第 7 章 “CDN 的 经 济 学 设计 


Nicolas Christin, John Chuang 和 Jens Grossklags 
7.1 引言 


在 过 去 的 10 年 ， 互 联网 内 容 及 其 分 发 手段 都 发 生 了 巨大 的 变化 。 在 20 世纪 90 
年 代 中 期 ， 电 子 商 务 和 Web 服务 的 发 展 使 HTTP 信息 成 为 互联 网 上 的 主要 内 容 ， 这 就 
使 网 络 上 的 计算 机 人 能够 被 简单 地 区 分 为 客户 端 或 服务 器 。 然 而 ， 随 后 的 两 个 重要 事件 
从 根本 上 改变 了 互联 网 的 面貌 。 

首先 ，1999 年 出 现 的 Napster 服务 “宣告 了 对 等 计算 时 代 的 来 临 。P2P 计算 明显 
不 同 于 之 前 的 (目前 是 共存 的 ) 客户 端 /服务 器 模式 ， 因 为 网 络 边 缘 处 的 任何 一 台 主 
机 都 能 作为 信息 的 提供 者 。 其 次 ， 高 分 辨 率 相 机 、 摄 像 机 或 具有 采样 功能 的 高 质量 声 
卡 的 普及 使 得 数字 产品 变 得 大 众 化 。 这 些 反 过 来 导致 了 用 户 自己 生成 的 内 容 的 大 量 出 
现 ， 尤 其 是 在 各 种 信息 传播 平台 (如 博客 ) 越 来 越 易于 使 用 时 ， 这 种 情况 变 得 更 加 
明显 。 

简 而 言 之 ,终端 用 户 目 前 已 经 具备 了 相应 的 工具 和 资源 ， 使 他 们 可 以 作为 主动 的 
内 容 发 布 者 。 不 过 ， 与 此 同时 (也许 是 被 这 种 情况 推动 ?) ， 也 出 现 了 一 些 新 的 现象 ， 
如 公共 地 悲剧 (tragedy of the commons) !”? 。 

一 个 典型 的 例子 可 以 很 好 地 解释 公共 地 悲剧 问题 。 假 设 有 一 个 牧场 ， 其 中 供养 着 
固定 数量 的 羊 ， 这 个 牧场 是 一 个 被 所 有 牧羊 人 共享 的 公共 资源 。 每 个 牧羊 人 在 他 的 羊 
群 数量 稍微 增加 时 可 以 得 到 一 个 明显 的 收益 : 更 多 的 羊 意味 着 更 多 的 羊毛 ， 也 就 意味 
着 更 多 的 收入 ; 而 且 ， 如 果 牧 场 足 够 大 ， 自 然 没 人 会 介意 多 一 两 只 羊 吃 草 。 问 题 是 ， 
所 有 的 牧羊 人 可 能 都 会 这 么 想 ， 最 终 造成 在 牧场 中 的 羊 数 大 量 增加 。 在 最 坏 情况 下 
(所 谓 的 “悲剧 " ) ， 牧 场 中 的 草 迅 速 耗 尽 ， 羊 全 都 俄 死 ， 最 终 所 有 的 牧羊 人 都 失去 了 
他 们 的 一 切 资源 。 公 共 地 悲剧 从 社会 视角 说 明了 每 个 个 体 自身 的 动机 (incentive) 与 
其 愿景 之 间 的 失调 。 

公共 地 悲剧 现象 已 经 出 现在 现代 信息 网 络 ， 如 PP 系统 中 就 有 很 多 这 种 动机 失 
调 的 例子 。 在 一 个 目前 被 广泛 引用 的 研究 中 Adar 和 Huberman 发 现 Gnutella 文件 
共享 网 络 中 多 达 70% 的 用 户 没 有 共享 出 任何 数据 ， 而 是 在 “ 足 车 ”"， 也 就 是 只 从 服务 
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中 收益 而 不 做 任何 贡献 。 这 项 研究 中 发 现 ，Gnutella 网 络 实质 上 是 在 靠 1% WAP xc 
撑 着 ， 这 些 用 户 对 50% 的 请 求 进行 服务 。 换 句 话说 ， 这 种“ 蹦 车 ”的 现象 使 得 Cnu- 
tella 网 络 实际 上 非常 类 似 一 个 中 央 服 务 器 式 的 集中 型 网 络 ， 这 就 与 P2P 网 络 的 基本 原 
则 背道而驰 一 一 P2P 网 络 本 应 能 够 推动 所 有 参与 者 之 间 的 信息 共享 和 合作 。 

在 其 他 的 相关 研究 中 ， 也 揭示 了 P2P 网 络 中 另外 一 些 严重 的 足 车 现象 ”以 及 ad - 
hoc 网 络 中 的 不 公 问 题 ” 。 这 些 观 察 到 的 现象 表明 ， 用 户 基本 上 是 理性 的 ， 绝 大 多 数 用 
户 做 事 首先 是 基于 自己 的 利益 。 这 就 是 说 ， 他 们 感 兴趣 的 是 能 否 从 网 络 中 获得 最 大 的 收 
益 ， 并 最 小 化 其 成 本 〈 即 所 谓 “ 自 私 ” 行 为 ) 。 

用 户 的 这 种 理性 (或 自私 性 ) 对 参与 开发 CDN 的 相关 各 方 有 什么 影响 呢 ? 毕竟 ， 
KBR CDN 不 属于 同一 个 单位 ， 也 就 无 法 有 力 地 控制 所 有 的 参与 者 和 解决 任何 动机 
失调 的 问题 。 

实际 上 ， 对 于 CDN 设计 者 来 说 ， 对 参与 者 动机 的 研究 与 几 个 利益 层面 有 关 : 

1) 一 个 内 容 提供 商 可 能 需要 将 终端 用 户 变 为 内 容 分 发 机 制 的 协助 者 ， 以 便 提 高 
对 用 户 的 服务 质量 和 降低 网 络 设施 的 成 本 ” ， 这 可 能 是 一 个 很 有 吸引 力 的 机 制 ， 尤 
其 是 对 于 大 规模 、 带 宽 密集 型 内 容 ( 如 视频 点 播 ) 的 提供 商 。 以 知名 度 不 断 上 升 的 
YouTube' ”为 例 ， 对 这 类 服务 的 需求 在 不 久 的 将 来 会 变 得 相当 大 ， 因 此 可 能 需要 重新 
考虑 分 发 设施 的 设计 。 

2) 不 同 服务 提供 商 经 营 的 CDN 可 能 需要 互联 ， 但 由 于 服务 提供 商 之 间 一 般 存 在 
竞争 关系 ， 所 以 研究 它们 各 自 的 动机 可 以 有 助 于 设计 可 行 的 服务 级 协议 。 

3) 即使 假设 参与 者 都 服从 指挥 (就 像 所 有 CDN 设施 都 由 一 个 单位 控制 和 所 有 那 
样 )， 这 时 一 个 重要 的 问题 就 是 : 为 了 保证 系统 正常 运转 ， 必 须 能 够 确定 每 个 参与 者 
需要 为 系统 贡献 的 资源 数量 。 这 个 分 析 人 允许 网 络 构造 者 洞悉 潜在 的 “热点 " ， 即 网 络 
上 那些 处 理 负载 极 大 使 得 投资 远 远 超出 其 可 用 资源 的 部 分 。 既 然 网 络 在 巨大 负载 下 工 
作 时 热点 可 能 是 主要 的 失效 点 ， 那 么 其 辨识 就 变 得 至 关 重 要 。 

4) 理解 网 络 参 与 者 各 方 的 成 本 和 收益 可 以 有 助 于 选择 切实 可 行 的 用 户 定价 方 
案 ， 这 将 在 其 他 章节 讨论 。 

所 有 这 些 问题 可 以 引导 我 们 从 根本 上 理解 在 设计 CDN 结构 时 参与 者 的 动机 以 及 
参与 各 方 提供 的 资源 。 

虽然 与 网 络 技术 相 比 这 类 研究 还 较 新 ， 但 在 应 用 数学 和 经 济 学 领域 已 研究 了 很 多 
年 ， 一 个 典型 的 研究 内 容 是 博弈 论 ， 研 究 非 协作 实体 之 间 的 策略 交互 ， 一 直 以 来 用 于 
理解 和 建 模 竞争 市 场 ， 如 证 券 市 场 中 相互 竞争 的 投资 者 。 近 年 来 的 研究 工作 显示 ， 当 
存在 着 (潜在 的 ) 自私 参与 者 时 ， 博 弈 论 可 以 很 好 地 为 网 络 设 计 和 评估 提供 一 个 规 
wwe’. 

本 章 建 立 在 博弈 论 研 究 的 基础 上 ， 做 出 的 贡献 如 下 : 首先 ， 为 一 个 内 容 分 发 覆 
盖 网 中 的 代理 设计 了 一 个 新 的 代价 模型 ， 用 于 对 CDN 中 动机 失调 的 根本 原因 进行 
了 分 析 。 另 外 ， 研 究 了 P2P CDN 文献 中 提供 的 一 些 网 络 结构 ， 以 确定 它们 是 否 是 
激励 相 容 的 。 最 后 ， 回 顾 了 一 些 传统 的 博弈 论 假 设 ， 研 究 它 们 在 CDN 设计 上 的 适 
用 性 。 
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本 章 余下 内 容 组 织 如 下 : 767.2 节 ， 对 分 析 中 用 到 的 博弈 论 概念 进行 简要 的 介 
绍 ， 并 回顾 一 些 与 本 章 讨论 相关 的 研究 ; 7.3 节 给 出 代价 模型 ; 在 7.4 节 ， 使 用 该 模 
型 对 CDN 连接 建立 中 的 动机 进行 了 分 析 ; 7.5 节 中 ， 将 本 章 对 动机 的 分 析 与 近年 出 
现 的 网 络 设施 相 结合 ; 7. 6 节 中 使 用 数值 仿真 对 上 述 分 析 进 行 验证 ; 7.7 节 讨 论 了 分 
析 中 使 用 的 一 些 假设 条 件 在 放宽 后 如 何 对 结果 产生 影响 ; 7. 8 节 中 指出 未 来 的 研究 方 
向 ; 7.9 节 中 给 出 了 总 结 和 简要 的 结论 。 


7.2 背景 和 相关 工作 


如 上 所 述 ， 通 过 对 用 户 理性 行为 的 观察 ， 系 统 构建 者 的 兴趣 越 来 越 多 地 集中 在 将 
网 络 参与 者 视 为 自私 ”或 竞争 “ :的 实体 。 这 些 概念 已 经 应 用 于 一 些 现 有 的 P2P 系 
统 。 例 如 ， 为 了 减少 蹦 车 现象 ， 一 些 知 名 的 P2P 系统 (如 KaZaA 或 BitTorrent"? ) 采 
用 了 一 些 简单 的 激励 机 制 。 更 普遍 的 做 法 是 ,很 多 近年 来 的 研究 将 博弈 论 和 机 制 设计 
中 的 概念 应 用 于 网 络 系统 ， 通 过 最 大 化 整个 系统 的 性 能 来 协调 每 个 (对 自身 利益 感 
兴趣 的 ) 用 户 的 动机 ””。 在 本 节 ， 首 先 回 顾 一 些 基本 的 博弈 论 概念 ， 然 后 对 相关 
工作 进行 更 全 面 的 讨论 。 


7.2.1 博弈 论 背 景 


博弈 论 的 基础 之 一 是 竞争 均衡 的 概念 ， 用 于 预测 用 户 的 行为 和 推断 一 个 竞争 博弈 
的 结果 。 如 参考 文献 [37] 中 所 述 ， 纳 什 均衡 的 概念 主要 用 于 对 用 户 行为 特性 的 系 
统 研究 。 使 用 纳什 均衡 进行 建 模 的 一 个 吸引 人 之 处 ， 是 它 可 以 识别 个 体 动机 与 其 他 参 
与 者 动机 之 间 的 张力 |。 

设 每 个 用 户 具 有 一 个 效用 (utility) ， 其 取 值 决定 于 该 用 户 所 采用 的 策略 。 当 给 定 
其 他 用 户 采 取 的 一 组 策略 时 ， 纳 什 均衡 定义 为 一 组 策略 : 如 果 用 户 希望 最 大 化 自己 的 
效用 ， 那 么 他 们 就 必须 选择 这 组 策略 。 

规范 地 说 ， 对 于 以 下 简单 形式 的 策略 交互 ( 称 为 博弈 ) : 一 个 博弈 中 单个 决策 
的 制定 者 (也 称 为 参与 者 ) 根据 自己 可 用 的 策略 选择 其 行为 。 在 所 有 参与 者 行为 
的 相互 作用 下 ， 每 个 参与 者 将 获得 收益 (payoff) 。 简 单 地 说 ， 每 个 参与 者 自行 决 
定 自己 采取 一 个 什么 样 的 行为 。 基 于 自己 和 其 他 参与 者 的 行为 ， 该 参与 者 得 到 奖 
励 或 惩罚 。 在 经 济 学 中 ， 这 种 奖惩 用 一 个 一 般 化 的 术语 “效用 ”来 表示 ， 有 时 也 
可 以 用 一 种 货币 的 形式 表示 。 在 系统 设计 (如 CDN 设计) 时 ,效用 可 以 表示 货币 
数量 ， 当 然 也 可 以 采用 其 他 的 形式 表示 。 效 用 可 以 表示 用 户 的 满意 度 指标 ， 该 指 
标 可 以 有 各 种 定义 方式 ， 比 如 说 它 可 以 是 一 个 下 降 的 延 时 、 增 加 的 吞吐 量 或 总 体 
上 更 好 服务 的 函数 。 

更 准确 地 说 ， 考 虑 一 个 参与 者 的 集合 Y= 11, =, NI, JHZ, des B S u 可 用 的 所 
有 纯 策略 (pure strategy， 即 确定 的 策略 ) 的 集合 ，Z ERRIA u 以 外 的 其 他 参与 者 
可 用 的 策略 集合 ,表示 参与 者 的 策略 集合 中 的 任意 一 个 策略 。C, 代 表 参 与 者 的 收益 
(或 效用 ) 函数 : 给 定 参 与 者 4 的 策略 L, 和 其 他 参与 者 的 策略 6_,，C。(t，4-。) RRS 
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与 者 的 收益 。 一 个 有 NN 个 参与 者 的 博弈 可 以 描述 为 G= {V3Z,,Z_3C,,C_.} 

当 所 有 参与 者 采取 一 定 的 策略 组 合 时 ， 如 果 任 意 一 个 参与 者 的 策略 变化 ， 都 将 导致 
其 效用 较 变 化 前 下 降 ， 那 么 所 有 的 参与 者 处 于 一 个 纳什 均衡 95 。 一 个 纳什 均衡 定义 为 

定义 1: MRMF RAW veV AL, EZ, C (lka) C, sx)<0， 则 
一 个 纯 策略 向 量 C * = (0, * ,…iw* ) eZ 构成 博弈 G 的 一 个 ( 纯 ) 纳什 均衡 。 

纳什 均衡 的 概念 可 以 扩展 到 概率 化 策略 (probabilistic strategies) 。 确 实 存在 这 样 
的 博弈 : 参与 者 采取 的 最 优 策 略 是 非 确定 性 的 。 例 如 ， 足 球 比赛 中 一 个 守门 员 在 面 对 
罚球 时 ， 总 是 向 右 扑救 的 策略 很 明显 并 非 上 策 ， 因 为 对 手 很 快 就 能 发 现 这 个 规律 。 与 
其 相反 ， 大 多 数 守门 员 会 稍稍 让 他 们 的 策略 变 得 不 确定 ， 例 如 要 是 罚球 手 用 左 腿 罚球 
他 们 就 以 70% 的 概率 向 右 扑救 。 

注意 ， 这 种 概率 化 的 策略 与 完全 随机 的 行为 是 不 同 的 。 在 计算 机 系统 中 ， 概 率 化 
策略 对 于 应 对 那些 以 概率 形式 来 影响 用 户 行为 的 外 在 条 件 是 很 有 用 的 ， 如 网 络 拥塞 、 
无 线 信道 中 的 噪声 等 。 

具有 一 定 概率 分 布 的 纯 策 略称 为 混合 策略 o,。 相 应 地 ， 对 于 每 一 个 参与 者 来 说 ， 
其 混合 策略 的 集合 区 ,包含 了 纯 策略 Z, 的 集合 ( 纯 策 略 作为 退化 后 的 特例 ) 。 每 一 个 
参与 者 的 随机 选择 都 在 统计 意义 上 与 其 他 参与 者 相互 独立 。 一 个 由 NN 个 参与 者 组 成 
的 混合 策略 博弈 可 以 被 描述 为 C= |V; X, X 50s Cule 

纳什 均衡 的 概念 可 以 引入 到 混合 策略 中 。 

定义 2: 如 果 对 于 所 有 ueV 和 o,e 二,， 都 有 

C,(o,,07,) - (o; ,o2,) <0 
则 一 个 混合 策略 向 量 go" = (0) ,… ,0 ) <e 工 构成 了 博弈 G 的 一 个 混合 策略 纳什 均衡 。 

下 面 给 出 的 第 三 个 定义 是 所 谓 的 “社会 最 优 ”。 纳 什 策略 在 本 质 上 揭示 的 是 每 个 
参与 者 面 对 其 他 所 有 参与 者 的 策略 时 所 能 做 出 的 最 优 反应 ， 而 社会 最 优 描 述 的 是 对 于 
所 有 参与 者 而 言 的 最 优 ， 也 就 是 将 所 有 参与 者 作为 一 个 整体 来 考虑 。 从 本 质 上 来 说 ， 
纳什 均衡 是 每 个 参与 者 针对 其 他 参与 者 的 策略 做 出 的 对 自己 最 优 的 策略 ， 而 社会 最 优 
则 就 像 是 在 一 个 “好 心 ”的 强权 人 物 操纵 下 ， 使 所 有 参与 者 采取 了 一 种 策略 组 合 ， 
在 这 种 组 合 下 所 有 参与 者 的 平均 收益 是 最 高 的 。 

回 到 上 述 公共 牧场 放羊 的 例子 ， 每 一 个 参与 者 〈 牧 羊 人 ) 的 纳什 策略 就 是 使 他 / 
她 所 有 的 羊 使 用 牧场 。 然 而 ， 前 面 已 经 提 到 ， 所 有 的 参与 者 都 采纳 这 种 策略 的 话 ， 最 
终 会 导致 灾难 的 发 生 。 另 外 ， 一 个 社会 最 优 策略 能 够 强制 性 地 限制 每 一 个 牧羊 人 能 够 
在 牧场 上 放牧 的 羊 数 ， 从 而 使 所 有 的 羊 都 能 吃 饱 。 

社会 最 优 的 定义 如 下 : | 

定义 3: 一 个 纯 策略 向 量 4” = (T osa) ES ELTER C 的 一 个 社会 最 优 ， 
4AM 4M FAW eZ, X,C, (£7) - XC, (0 «0? 

也 就 是 说 ， 社 会 最 优 就 是 能 够 最 大 化 所 有 参与 者 效用 的 策略 (或 一 组 策略 ) 。 


O ”原文 条 件 中 的 “<” 应 该 为 “>"。 一 一 译 者 注 
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7.2.2 博弈 论 在 网 络 问题 上 的 应 用 


近来 ，CDN 领域 开始 关注 博弈 论 在 算法 和 联网 问题 上 的 应 用 。 参 考 文献 [36] 介 
绍 了 博弈 论 在 算法 问题 上 的 应 用 状况 。 本 节 不 再 提供 该 方面 的 文献 综述 ， 而 是 主要 讨论 
较 少 一 部 分 的 文献 ， 它 们 代表 了 本 研究 领域 的 一 些 主流 方向 ， 能 够 为 CDN 设计 者 提供 
参考 。 具 体 而 言 ， 这 里 关注 的 是 如 下 领域 内 的 研究 : 网 络 路 由 、 缓 存 技术 和 网 络 形成 。 

1. 流量 的 路 由 

通过 研究 一 个 特定 的 案例 ，Braess'“ 的 研究 表明 当 添 加 一 个 新 的 路 由 来 增加 网 络 吞 吐 
量 时 反而 有 可 能 会 对 整个 网 络 的 性 能 产生 负面 影响 。 在 此 之 后 ， 很 多 论文 试图 搞 清 路 由 数 
据 的 特性 。 例 如 ， 参 考 文献 [43] 通过 设 定 边 界 来 研究 当 用 户 能 够 自由 选择 如 何 路 由 他 们 
的 流量 时 网 络 状况 会 变 得 多 差 ， 借 此 泛 化 了 Braess 揭示 的 这 种 自 相 矛盾 的 现象 。 

其 他 文献 对 博弈 论 在 路 由 方面 的 应 用 情况 也 进行 了 研究 "5 ， 主 要 涉及 如 何在 多 
跳 网 络 中 避免 不 希望 发 生 的 隐藏 行为 ”。 这 个 问题 是 指 ， 在 大 多 数 多 跳 网 络 中 ， 端 节点 
只 能 确定 端 到 端的 传输 是 否 成 功 ， 而 一 般 很 难 监控 到 负责 将 报 文 进行 路 由 的 中 间 节 点 的 
行为 。 因 此 ， 如 果 不 清楚 中 间 层 节点 正常 工作 的 内 在 原因 ， 那 么 节点 在 路 由 流量 的 时 候 
采取 随意 丢弃 报 文 或 者 调 低 报 文 优先 级 的 策略 就 会 具有 很 大 的 风险 。Feldman A ft 
研究 表明 ， 好 的 契约 设计 (contract design) 对 于 解决 隐藏 行为 是 非常 重要 的 。 

2. 缓存 和 副本 

很 多 论文 (如 参考 文献 [14, 20, 38]) 研究 了 在 分 发 网 络 中 数据 缓存 和 复制 时 
的 内 在 动机 。 在 大 尺度 上 ， 建 立 缓存 的 动机 可 以 主要 分 为 两 类 。 对 于 一 个 CDN RH 
盖 网 ， 需 要 确定 数据 存储 在 什么 位 置 可 以 满足 性 能 要 求 ， 同 时 又 要 避免 一 些 缓存 所 在 
的 节点 产生 逃离 网 络 的 动机 。 另 外 ， 由 竞争 对 手 所 运营 的 不 同 的 CDN 可 能 需要 互 连 ， 
这 会 导致 一 个 激励 相 容 ? 的 契约 设计 问题 。 

3. 网 络 形成 

很 大 一 部 分 研究 工作 '”*… ”分析 了 网 络 形成 的 原因 。 也 就 是 说 ， 对 于 一 个 由 
存在 着 潜在 竞争 关系 的 理性 实体 组 成 的 网 络 ， 这 些 文 献 研究 了 一 个 新 的 理性 参与 者 是 
如 何 加 入 网 络 的 。 这 个 问题 可 以 认为 是 一 个 典型 的 图 问题 ， 现 有 网 络 可 以 表达 为 一 组 
节点 的 集合 ， 这 些 节点 通过 一 组 边 相 连 。 由 网 络 形成 引出 的 问题 可 以 被 分 解 为 如 下 一 
系列 问题 : 在 一 个 现 有 网 络 中 新 加 入 节点 将 与 已 有 节点 建立 什么 样 的 新 连接 ( 边 )? 
当 新 节点 接 人 网 络 后 ， 会 有 某 些 边 被 取消 吗 ? 连接 的 创建 可 以 被 建 模 为 一 个 动机 问 
题 : 一 个 节点 仅 在 能 够 增加 其 效用 的 情况 下 创建 或 者 移 除 一 个 与 其 他 节点 的 连接 。 

网 络 形成 的 代价 模型 起 初 被 提出 时 是 用 于 研究 社会 和 经 济 网 络 的 形成 ”， 如 确 


© (RAT (hidden action) 来 自 委托 代理 理论 ， 该 理论 建立 在 信息 不 对 称 博弈 的 基础 上 ， 是 指 在 某 次 活 
动 中 某 些 参与 人 拥有 其 他 参与 人 不 拥有 的 信息 ， 故 而 背 着 其 他 人 所 做 出 的 有 利于 自己 利益 的 行为 。 一 一 译 者 注 

C) MIIMA (incentive - compatible); 来 自 Hurwiez 建立 的 机 制 设计 理论 。 每 个 理性 人 都 会 按照 自 利 
的 原则 行动 ， 如 果 能 设计 一 种 制度 ， 使 每 个 人 追求 个 人 利益 的 行为 ， 正 好 与 集体 价值 最 大 化 的 目标 相 吻 
合 ， 那 么 这 种 制度 就 是 “激励 相 容 ”的 。 一 一 译 者 注 
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定 不 同学 者 之 间 合 作 共 写 一 篇 论文 的 可 能 性 。 在 这 些 社会 、 经 济 模型 的 基础 上 ， 近 来 
的 研究 "'“ ”分 析 了 将 对 等 网 络 形成 作为 非 合作 博弈 的 问题 。 在 这 个 问题 中 ， 节 点 硕 
望 加 入 到 网 络 中 ， 同 时 也 希望 付出 最 小 的 代价 。 早 期 的 研究 工作 关注 的 是 节点 之 间 的 
距离 和 连接 度 ， 将 之 作为 计算 每 一 个 节点 的 效用 函数 的 主要 参数 。 之 后 的 工作 对 早期 
的 研究 进行 了 拓展 ， 除 了 上 述 距离 和 连接 度 外 还 考虑 到 了 每 一 个 节点 上 的 负载 。 
在 本 章 接 下 来 的 部 分 将 详细 介绍 这 些 代 价 函 数 。 


7.3 CDN 的 代价 和 效益 建 模 


本 章 的 核心 是 一 个 代价 模型 ， 该 模型 的 作用 是 评估 当 一 个 给 定 节点 加 入 到 CDN 
或 覆盖 网 时 ， 它 必须 付出 的 资源 数量 ， 以 及 它 的 加 入 给 网 络 带 来 的 效益 。 这 里 用 一 个 
开销 下 降 的 概念 来 表示 加 入 CDN 带 来 的 效益 ， 需 要 指出 的 是 ， 该 模型 并 不 仅仅 适用 
于 CDN， 事 实 上 它 可 以 应 用 于 存在 以 下 行为 的 任何 网 络 中 : 节点 请 求 资 源 和 提供 资 
源 服 务 ， 或 者 对 其 他 节点 之 间 的 请 求 进行 服务 。 这 样 的 网 络 除了 CDN 之 外 ， 也 包括 
P2P 文件 共享 系统 [256] ad- hoe 网 络 '”!、 分 布 式 检索 服务 (distributed lookup serv- 
ices) 5) 、 应 用 层 组 播 覆 盖 网 (application — layer multicast overlays) ^^? 4$, 3€ 7.1 
中 列 出 了 该 模型 中 使 用 的 主要 符号 。 

严格 地 说 ， 可 以 使 用 一 个 四 元 组 (V,E,K,F) 来 定义 一 个 网 络 (CDN, Biz 
等 ) 。 其 中 , V 是 网 络 中 的 节点 集 , E 是 有 向 边 集 ，K 是 网 络 中 相关 资源 的 集合 ,FF: 
K—V 是 将 资源 分 配 到 节点 的 映射 函数 。 

每 一 个 节点 we 了 被 分 配 一 个 唯一 的 标识 (整数 或 者 字符 串 )， 为 简单 起 见 用 4 
RRR. EM K, = Ike KsF(k) =w| 为 存储 在 节点 ue V 中 的 资源 集合 ， 有 =U,K,， 
且 不 失 一 般 性 假设 集合 K, 之 间 不 相交 。 事 实 上 ， 如 果 一 个 资源 被 存储 在 多 个 节点 处 
(复制 ) ， 那 么 这 些 副本 可 被 视 为 不 同 的 资源 ， 且 被 请 求 的 概率 完全 相同 。 








表 7.1 符号 说 明 
内 容 属 性 
K, 节点 4 拥有 的 资源 集合 
F 内 容 到 节点 的 映射 函数 
d 发 出 请 求 的 源 节点 开销 测量 和 函数 
Y 被 请 求 的 资源 b, 节点 u 的 延 时 开销 
网 络 属性 R, 节点 4 的 路 由 开销 
EE So suu S, 节点 二 的 服务 开销 
aa M, 节点 的 维护 开销 
K 网 络 中 资源 的 集合 m Di ERS 
N 节点 个 数 Lao 节点 4 请 求 资源 上 的 标 称 开销 
D 维度 nao 节点 4 转发 资源 的 标 称 开销 
A 基 sa 节点 习 提 供 资 源 大 的 标 称 开销 
网 络 测量 mu, 0 节点 4 维护 节点 vb 的 信息 的 标 称 开销 
tu 节点 4 和 vw 之 间 的 跳 数 C, 节点 wu 的 总 开销 
Xow(4) W u EBE WA o E w 的 路 径 上 C 网 络 的 总 开销 
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通过 两 个 相互 独立 的 随机 变量 Xe 了 和 了 e 天 来 分 析 每 一 个 请 求 ， 它 们 分 别 表示 
发 出 请 求 的 节点 下 和 被 请 求 的 资源 Y- 

对 于 一 个 给 定 节点 ue V， 每 当 一 个 资源 keK 在 整个 网 络 中 被 请 求 时 ， 节 点 将 
处 于 如 下 四 种 状态 之 一 。 

1. 空闲 

节点 不 拥有 上 或 者 没有 请 求 &， 也 并 不 处 于 请 求 路 由 路 径 上 。 节 点 w 没有 任何 
代价 问题 。 

2. 分 发 请 求 | 

节点 请 求 资源 k。 在 本 章 的 模型 中 ， 用 减少 等 待 时 间 的 形式 来 表示 加 入 一 个 P2P 
网 络 的 收益 ， 这 与 参考 文献 [17] 等 提出 的 方法 类 似 。 特 别 地 ， 假 定 持 有 资源 大 的 节点 
v Bu 距离 越 远 (从 拓扑 意义 上 而 言 )， 请 求 所 付出 的 开销 越 高 。 如 果 在 节点 w 和 w 之 间 
没有 通路 ， 那 么 请 求 无 法 执行 ， 这 会 产生 无 穷 大 的 开销 。 更 确切 地 说 ， 这 里 将 u R k 
产生 的 开销 建 模 成 为 1, ,i,,， 其 中 ,是 从 w Bo ZAM, Me (1E) 比例 因 
Te. EU ER u 的 延 时 开销 工 ,为 个 体 开销 1, Lt, , 乘 以 k 被 请 求 的 概率 ， 即 

L, = Y Dl,,PrlY = k] (7.1) 


其 中 ， 如 果 没 有 从 节点 到 vw 的 路 径 ， 那么 1,, = %w% ， 且 对 于 任意 uw， 有 ,=0。 使 用 
该 定义 ， 为 了 避免 无 穷 大 的 开销 ， 每 一 个 节点 都 有 创建 连接 的 动机 ， 以 便 与 其 他 持 有 
其 感 兴趣 资源 的 节点 之 间 存 在 路 径 。 另 一 种 方案 是 在 本 地 存储 或 缓存 所 有 感 兴趣 的 资 
源 ， 这 样 所 有 请 求 的 开销 可 降 至 1 =0。 

下 面 给 出 一 个 延 时 开销 的 具体 例子 : 域名 解析 服务 (DNS), DNS 可 以 被 视 为 
一 个 使 用 树 形 拓扑 的 覆盖 网 ， 其 中 叶 节 点 是 DNS 用 户 ， 其 他 节点 是 DNS 服务 器 。 假 
设 一 个 用 户 u 需要 访问 DNS 上 的 一 个 记录 上， 如 果 上 之 前 被 访问 的 极 少 ， 以 至 于 请 求 
需要 被 转发 到 DNS 根 服务 器 v， 这 时 可 能 会 得 到 一 个 从 Blo 之 间 的 很 高 的 跳 数 ， 如 
t, ,=5。 在 请 求 被 解析 之 后 ，w 的 主 DNS 服务 器 vw' 将 具有 下 的 一 个 副本 ， 这 就 将 从 
到 vw 的 请 求 延 时 开销 从 1,,, =5 降低 到 i,,, =1。 引 入 权重 7, 表示 不 同 资源 之 间 的 相 
对 重要 程度 , R (7.1) Pu 的 延 时 表示 为 w 所 有 请 求 延 时 的 加 权 平 均 。 在 这 个 DNS 
的 例子 中 ， 从 节点 的 角度 来 说 ， 如 果 解 析 k = www. google. com 的 能 力 比 解析 
k' = dogmatix. sims. berkeley. edu 的 能 力 高 100 倍 ， 那 么 就 应 该 使 1,， , =1001, vo 

3. 服务 请 求 

节点 拥有 资源 k， 且 对 请 求 进行 服务 的 开销 为 s,,。 例 如 ， 在 文件 共享 系统 中 ， 
节点 提供 文件 服务 需要 占用 一 定 的 上 传 带宽 。 定 义 服务 开销 5, 为 ;,,, 在 所 有 可 能 请 求 
下 的 数学 期 望 ， 即 

S, = 2, Sua Prl Y = k] 


回 到 前 面 的 DNS 例子 ， 在 DNS 服务 器 u' 中 添加 一 条 关于 的 记录 意味 着 w' 需 要 
付出 一 些 存储 资源 ， 这 里 的 模型 将 其 表达 为 服务 开销 5,, 的 一 个 增 量 。 在 DNS 的 例子 
中 ,对 于 一 个 给 定 的 DNS 服务 器 ， 对 DNS 服务 器 中 记录 上 的 服务 开销 与 所 有 其 他 的 
记录 都 是 一 样 的 ， 因 此 对 于 所 有 上 ，s*,，, =s,， 这 对 应 于 存储 一 个 记录 的 代价 。 
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4. 转发 请 求 

节点 并 不 持 有 或 者 请 求 ¢, 但 是 需要 将 对 & 的 请 求 转发 出 去 ， 因 此 需要 付出 开 
销 7,;。 对 于 经 过 节点 的 所 有 可 能 的 请 求 路 径 ， 它 需要 付出 的 总 的 路 由 开销 R, 为 转 
发 所 有 资源 的 开销 7, ,的 平均 值 。 也 就 是 说 ， 对 于 (u,v,w) e V 有 二 值 函数 


1, 如 果 守 位 于 从 到 zw 的 路 径 上 (不 含 v 和 ww) 
Xu Cu) =l 其 他 
R, 的 表达 式 为 
= DY XB = vlPr[Y = ky.) (7.2) 


以 DNS 为 例 ， 路 由 开销 表示 : 对 于 所 有 可 能 的 请 求 ， 一 个 服务 器 收 到 对 上 大 的 请 
求 但 无 法 解析 % 的 位 置 ， 从 而 将 请 求 转发 到 DNS 树 的 更 高 级 服务 器 时 ， 该 服务 器 所 
使 用 的 资源 的 平均 值 。 

另外 ， 每 一 个 节点 都 维护 某 些 状态 信息 使 得 网 络 控制 协议 能 够 正确 运转 。 在 大 多 
数 覆 盖 网 协议 中 ， 每 一 个 节点 屏 都 需要 维护 一 个 邻接 表 并 与 所 有 邻 节 点 交换 信息 ， 也 
Rew, WRIA 是 导 的 邻 节 点 ， 则 存在 一 个 彼此 相连 的 边 (w,z) H Mu) ER u 
pence roe ear 

= Jm, 
AF, m,,20 RNA u TRIE TEER ce ANDERN ERIM. 

回 到 DNS 的 例子 ， 当 DNS 服务 器 u 收 到 的 请 求 不 能 在 本 地 服务 时 ,4 为 了 能 与 
其 附近 的 其 他 服务 器 进行 通信 而 需要 维护 相关 的 信息 ， 维 护 开销 即 为 wu 维护 相关 信息 
所 使 用 的 资源 。 

最 后 ,定义 节点 付出 的 总 代价 函数 C ,为 

C,=L,+S,+R,+M, 

可 以 使 用 C, 来 计算 整个 网 络 的 开销 ， 即 C = >,.,C,。 需 要 注意 的 是 ， 只 有 S, 
R,, M, ALL, 都 使 用 相同 的 单位 时 ，C, 的 表达 式 才 有 意义 ， 也 就 是 说 S us, rus, Lafi 
m,,, 等 系数 需要 正确 设 定 。 例 如 ， 如 果 ,按照 每 个 资源 每 跳 使 用 货币 单位 给 出 ， 那 么 
m,,, 也 需要 使 用 货币 单位 来 表示 。 


7.4 社会 最 优 和 纳什 均衡 


本 节 主 要 探讨 能 够 通过 上 面 定义 的 代价 模型 达到 一 个 社会 最 优 或 纳什 均衡 状态 的 
网 络 结构 。 规 范 地 说 ， 将 一 个 网 络 结构 定义 为 一 个 “几何 "* ， 即 与 路 由 选择 机 制 相 
关 的 由 一 些 节点 和 边 构 成 的 集合 〈 拓 扑 结构 ) 。 除 非 另 有 说 明 ， 均 默认 使 用 最 短路 径 
路 由 ， 并 区 分 不 同 的 拓扑 结构 。 在 讨论 一 些 可 能 的 社会 最 优 之 前 ， 将 使 用 一 些 简化 手 
段 ， 这 有 助 于 使 分 析 得 到 简化 。 在 分 析 过 程 中 ， 主 要 关注 结论 和 本 质 ， 大 多 数 技术 证 
明 的 细节 问题 不 占用 过 多 篇 幅 ， 建 议 感 兴趣 的 读者 可 参见 参考 文献 [11] 获得 一 个 
更 全 面 的 了 解 。 

假设 : 在 本 节 的 剩余 部 分 ， 以 一 个 含有 NN > 0) 个 节点 的 网 络 作为 分 析 对 象 ， 
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其 中 对 于 所 有 的 ueV 和 keK, L,-1, s,,2s, rT,%=7,. 同 时 对 于 所 有 的 weV 和 we 
V, m,, =m。 也 就 是 说 ,假定 所 有 节点 在 一 个 单 跳 延 时 、 响 应 一 个 请 求 、 路 由 一 个 请 
求 或 者 维护 一 个 连接 上 的 开销 完全 相同 ， 与 资源 被 请 求 还 是 被 服务 无 关 。 一 般 来 说 ， 
该 假设 较为 粗糙 ， 但 是 对 于 一 个 由 同 质 (homogeneous) 节点 构成 、 包 含 固 定 大 小 的 
资源 以 及 同 质 连接 的 网 络 而 言 这 样 的 简化 还 是 足够 精确 的 (尤其 是 对 于 基于 分 布 式 
哈 希 表 的 检索 机 制 来 说 ， 例 子 可 参见 参考 文献 [40, 42, 44, 48, 49])。 

假设 网 络 处 于 稳 态 ， 也 就 是 说 ， 节 点 不 会 加 入 或 者 脱离 网 络 ， 此 时 1、s、r 以 及 
m 的 值 都 是 常数 。 同 时 ,假设 请 求 在 所 有 节点 的 集合 上 服从 均匀 分 布 ， 即 对 于 任何 节 
点 w， 有 Pr[X=u] =1/N, 

在 分 析 中 ,做 了 进一步 的 简化 : 选择 映射 函数 下 使 得 所 有 的 节点 都 以 相同 的 概 
率 对 请 求 进行 服务 ， 即 区 ,。x Prl Y=k] =1AN， 这 意味 着 


$= 
也 就 是 说 ， 与 网 络 的 几何 结构 无 关 。 在 7.6 节 进 行 的 数值 仿真 中 将 取消 该 假设 。 另 
外 ， 如 果 使 用 E[X] 来 表示 变量 的 数学 期 望 ， 则 式 (7.1) 和 式 (7.2) 分 别 退 化 为 
L, =lE[t,,] 
R, =rEly, (4) ] 
另外 ， 因 为 每 一 个 节点 4 的 邻 节点 数 为 deg (&) ， 所 以 可 以 得 到 
M, 2 mdeg(u) 
最 后 ， 假 设 所 有 的 节点 都 不 会 出 现 亚 意 行 为 。 


7.4.1 全 网 状 网 


对 于 可 能 的 社会 最 优 ， 首 先 对 全 网 状 网 ( Full Mesh) 进行 分 析 。 在 一 个 全 网 状 
网 中 ， 每 一 对 节点 都 通过 双向 边 连接 ， 即 对 于 任意 节点 v 关 w，i,, =1。 全 网 状 网 中 节 
点 之 间 的 流量 和 路 由 都 是 相同 的 ， 因 为 任意 两 个 节点 之 间 总 有 一 条 直 连 的 边 ， 并 且 
deg(u) N-1, iX FÉ, XT BB u, AR, =0,L, - I(N -1)/N,M, » m(N - 1), 由 
S,=s/N, A C,=s/N+1(N-1)/N+m(N-1), uM, We 

C( 全 网 状 网 ) =s +1(N-1) +mN(N-1) (7.3) 

现在 开始 从 全 网 状 网 中 移 除 一 条 连接 ， 如 节点 0 一 1 的 连接 。 此 时 节点 0 的 维护 

开销 M, 降 低 了 m。 不 过 ， 为 了 访问 节点 1 上 的 资源 ， 节 点 0 就 需要 通过 其 他 节点 发 

送 请 求 。 节 点 0 经 由 哪个 节点 将 请 求 发 送 到 节点 1 的 实际 机 制 与 本 讨论 无 关 。 例 如 ， 

不 失 一 般 性 可 以 假定 节点 周期 性 地 从 自己 的 邻 节点 列表 中 选择 。 假 定 节点 0 选择 节点 
2， 那 么 LT WN， 且 节 点 2 的 路 由 开销 R 增 加 了 7r/N 。 

因此 ， 移 除 节点 0 至 节点 1 的 连接 后 总 开销 的 变化 为 "AC = -m+1N+r/N， 如 
果 AC>0， 那 么 移 除 连接 意味 着 总 开销 的 增加 ， 此 时 全 网 状 网 是 社会 最 优 。 特 别 地 ， 
有 如 下 命题 : 

命题 1: 全 网 状 网 是 社会 最 优 的 条 件 为 维护 代价 “足够 小 ， 即 


l r 
ms— t 


N N 


(7.4) 
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注意 ， 当 No 时 式 (7.4) 中 的 m 趋 于 0。 事 实 上 ,使 用 一 阶 泰勒 级 数 展开 式 ， 
可 以 将 AC=0 作为 影响 N 的 条 件 : S mec LV/r 时 ， N<| Lm + Jl. 

在 此 也 可 以 结合 DNS 对 式 (7.4) 进行 说 明 。 由 式 (7.4), ， 如 果 互 联网 主机 的 数 
量 维 持 在 合理 的 较 少 数量 上 ， 那 么 每 一 个 主机 就 可 以 借助 一 个 很 大 的 HOSTS. TXT x 
件 来 直接 将 主机 名 解析 为 TP 地 址 ， 从 而 有 效 地 为 命名 覆盖 创建 一 个 全 网 状 网 : 每 一 
个 节点 都 知道 所 有 其 他 的 节点 ?>。 只 有 在 互联 网 主机 的 数量 增加 到 在 单个 、 分 布 式 文 
件 上 维护 所 有 信息 变 得 不 切实 际 时 ， 才 引入 DNS 协议 。 


7.4.2 星 形 网 络 


现在 假设 式 (7.4) 并 不 成 立 ， 并 且 网 络 结构 为 一 个 星 形 拓扑 。 令 u =0 表示 星 
形 网 络 (Star Network) 的 中 心 ， 该 中 心 节点 对 所 有 外 围 节 点 的 流量 进行 路 由 。 也 就 
是 说 ， 对 于 所 有 的 节点 vw(v,w >0) , y, (0) =1。 显然 , R =r(NW-1)(N-2)ZN ， 
L, =i(N-1)/N,M,=m(N-1)。 这 时 ， 星 形 网 络 的 中 心 所 产生 的 开销 Cu 为 

C, =m(N-1) exu a 

外 围 节点 并 不 路 由 任何 流量 ， 即 对 于 所 有 的 uw>0， 有 R=0。 并 且 ， 所 有 的 外 围 
节点 与 星 形 网 络 中 心 节点 的 距离 为 1, 与 其 他 NN-2 个 节点 的 距离 为 2， 这 时 有 
L,=1(2n-3)/N, 535b, MFA DAA deg(u) =1。 这 时 ，M, =m， 同 时 节 
Au >0 的 单个 开销 为 





[A8] 


AN -3 
N 

命题 2: 只 有 当 NN 是 常数 或 1=r=m=0 时 ，C。 =C, 成 立 。 

证 明 : 假设 C - C, =0。 因 为 N 关 0， 所 以 C。- C, =0 等 价 于 N (C,-C,) =0。 
使 用 式 (7.5) 和 式 (7.6) 中 Cu 和 C, 的 表达 式 ， 将 条 件 N (C,-C,) =0 改写 为 N 
的 多 项 式 形式 ， 并 且 乘 以 因子 XV -2， 可 以 得 到 

(N-2)(mN -(l-r)N-r) =0 

NN 的 多 项 式 恒 等 于 0， 当 且 仅 当 多 项 式 的 所 有 系数 均 为 0， 因 此 1=r=m=0。 

对 于 星 形 网 络 ， 中 心 节点 和 其 他 节点 的 开销 存在 着 较 大 的 差异 ，C。 - C, 可 以 从 理 
论 上 对 激励 (阻碍 ) 一 个 节点 成 为 中 心 节点 的 因素 进行 量化 。 所 以 ， 从 命题 2 可 知 ， 
对 大 多 数 情 况 而 言 在 网 络 中 心 存在 着 一 个 激励 (阻碍 ) 节点 成 为 中 心 节点 的 因素 。 
在 实际 中 ， 星 形 布 局 的 网 络 代表 了 高 度 中 心 化 的 结构 ， 资 源 都 集中 在 一 个 “汇聚 
点 "。 这 个 汇聚 点 一 般 位 于 内 容 提供 商 处 ， 它 作为 一 个 独一无二 的 服务 器 并 凭借 其 中 
心地 位 ， 可 以 得 到 适当 的 补偿 〈 如 资金 上 的 投入 ) 。 

下 面 计算 星 形 网 络 的 整体 开销 ， 并 确定 在 什么 条 件 下 该 网 络 是 社会 最 优 。 对 式 
(7.5) 和 式 (7.6) 求 和 ， 可 得 





C, "mel (7.6) 


O 注意 : 这 里 只 关注 域名 解析 ，HOSTS. TXT XFER AUER — n onu sp, Sul EDU - 
种 集中 的 方式 完成 的 31。 一 一 原 书 注 
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C( 星 形 网 络 ) -2m(N -1) +s +20 YU" ,, Y=) (C -2) (7.7) 


命题 3: 对 于 任意 的 节点 数 >3 ， 星 形 网 络 是 社会 最 优 的 条 件 为 : R (7.4) 不 
成 立 ， 且 所 有 连接 是 双向 的 ， 即 对 于 任意 节点 weV, veV， 如 果 (w-w) eE 则 (wv 一 
u) EE, 

命题 3 的 证 明 可 参见 参考 文献 [11] 。 该 证 明 的 核心 是 反复 从 一 个 全 网 状 网 中 移 
除 连接 ， 直 到 网 络 近乎 断 开 。 由 此 表明 ， 星 形 配置 实际 上 最 大 化 了 所 有 参与 者 的 整体 
效用 。 

关于 命题 3 有 两 点 值得 注意 。 

首先 ， 命 题 3 并 没有 保证 星 形 网 络 是 一 个 唯一 的 社会 最 优 。 事实 上 , 当 m=WN+ 
AN 时 ,在 星 形 网 络 的 外 围 节点 之 间 加 入 任意 数量 的 “捷径 ”也 能 实现 社会 最 优 。 

其 次 ， 对 于 任意 的 W， 双 向 连接 这 一 假设 对 于 命题 3 的 成 立 至 关 重 要 。 例 如 ， 如 果 
允许 存在 单 向 连接 ,那么 可 以 推出 ， 如 果 严 足够 大 且 六 很 小 , 则 单 向 环 0 一 1 一 … 一 N 一 
1 的 开销 要 低 于 星 形 网 络 。 

然而 ， 在 允许 单 向 连接 的 情况 下 寻求 社会 最 优 是 一 个 尚未 解决 问题 ， 星 形 网 络 在 实 
际 应 用 中 仍然 会 占据 主要 地 位 ， 而 单 向 环 这 种 拓扑 结构 可 能 仅仅 使 用 于 限制 性 很 强 的 条 
件 下 。 更 简单 地 说 ， 以 上 分 析 表 明 ， 当 需要 维护 的 连接 数量 太 多 以 至 于 全 网 状 网 不 再 是 
具有 吸引 力 的 解决 方案 时 ， 从 资源 消耗 的 角度 可 以 认为 一 个 中 心 化 的 网 络 是 最 优 的 。 


7.4.3 纳什 均衡 


现在 假定 每 一 个 节点 都 可 以 选择 自己 需要 保持 的 连接 ,但 是 对 于 自身 具有 的 资源 
不 采取 任何 控制 ， 同 时 响应 所 有 路 由 请 求 。 换 句 话说 ， 每 一 个 节点 在 建立 连接 时 都 是 
自私 的 ， 但 是 一 旦 连接 建立 起 来 节点 就 不 再 这 样 。 当 每 一 个 节点 具有 完全) 理 
性 时 ， 即 在 已 知 其 他 节点 行为 的 前 提 下 试图 最 小 化 自身 的 开销 C,， 其 结果 是 形成 的 
拓扑 结构 成 为 了 一 个 纳什 均衡 ， 如 7.2 节 的 定义 。 

虽然 在 一 般 情况 下 不 能 保证 纳什 均衡 的 存在 性 或 唯一 性 ， 但 存在 以 下 均衡 : 

命题 4: 如 果 m < WN， 全 网 状 网 是 一 个 唯一 的 ( 纯 ) 纳什 均衡 。 

WAS: 如 果 m 宇 VN， 星 形 网 络 是 一 个 纯 纳什 均衡 。 

以 上 结论 可 以 通过 下 面 的 事实 验证 : 根据 命题 4 的 条 件 ， 移 除 全 网 状 网 的 连接 会 
降低 至 少 一 个 用 户 的 效用 值 。 反 之 ， 根 据 命题 5 的 条 件 ， 向 星 形 网 络 中 增加 的 一 条 连 
接 会 使 至 少 一 个 节点 的 效用 值 降低 。 

命题 4 和 命题 5 说 明 ， 如 果 维护 连接 的 成 本 不 高 或 网 络 结构 很 小 ， 那 么 唯一 的 纳 
什 均衡 就 是 全 网 状 网 ; 如 果 维 护 连接 的 成 本 很 高 或 网 络 结构 很 大 ， 那 么 星 形 网 络 是 一 
个 可 能 的 纳什 均衡 ， 且 不 能 保证 纳什 均衡 的 唯一 性 。 例 如 ， 当 m = WN 时 ， 通 过 在 星 
形 网 络 的 外 围 节 点 之 间 加 入 任意 数量 的 连接 所 构成 的 任何 网 络 都 会 构成 一 个 纳什 
均衡 。 

上 述 结论 是 参考 文献 [27] 中 结论 的 一 个 泛 化 ， 该 文献 使 用 的 是 一 个 不 同 的 代 
价 模型 ， 没 有 使 用 路 由 开销 。 
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7.4.4 解释 


上 述 结论 在 图 7. 1 中 进行 了 汇总 ， 图 中 根据 单位 维护 开销 m 的 值 来 区 分 社会 最 
优 和 纳什 均衡 。 





图 7.1 社会 最 优 和 纳什 均衡 (在 区 间 [MN,MN+N ]， 
单个 节点 的 动机 与 社会 最 优 失调 ) 


当 m<WN 时 ,全 网 状 网 既是 纳什 均衡 也 是 社会 最 优 ; 4m>i/N+r/N 时 ， 星 形 
网 络 既 是 纳什 均衡 也 是 社会 最 优 。 两 种 情况 下 ， 每 一 个 节点 的 动机 都 与 网 络 整体 资源 
最 高 效 的 利用 目标 相 一 致 ， 见 图 中 的 白色 区 域 。 

图 7. 1 中 最 值得 注意 的 是 灰色 区 域 ， 在 这 个 区 域 中 个 体 的 动机 与 高 效 利用 整体 资 
源 的 目标 是 相互 冲突 的 。 该 区 域 对 应 于 参数 区 间 L/N <m<l/N+r/N, KK)RRR 
于 r。 换 句 话说， 如 果 假 设 所 有 节点 都 以 相同 的 概率 对 请 求 进行 服务 ， 那 么 一 旦 节点 
很 在 乎 它们 帮助 其 他 节点 转发 流量 所 占用 的 自身 资源 ， 那 么 社会 最 优 可 能 会 与 纳什 均 
衡 明 显 背离 。 

从 上 述 分 析 可 知 ， 如 果 存 在 一 个 “转发 免费 ”的 网 络 (也 就 是 r=0， 如 带宽 和 
计算 能 力 无 限 廉价 ) ， 那 么 这 个 网 络 从 系统 设计 者 来 看 就 是 理想 的 ， 因 为 在 这 种 情况 
下 所 有 的 个 体 动机 就 应 该 可 以 形成 一 个 社会 最 优 的 解决 方案 。 然 而 不 幸 的 是 ， 在 大 多 
数 网 络 中 转发 数据 的 成 本 是 不 容 忽 略 的 。 这 表明 ， 相 对 于 以 前 模型 仅 考虑 基于 节点 度 
(如 维护 开销 ) 和 跳 数 (如 延 时 开销 ) ， 这 里 的 代价 模型 更 加 适合 于 捕获 节点 可 能 的 
消极 动机 。 

对 于 CDN 设计 者 而 言 ， 这 个 结果 产生 了 一 个 很 重要 的 结论 ， 即 要 么 CDN 被 设计 
为 尽 可 能 避免 让 节点 转发 过 多 的 数据 ; 要 么 ， 如 果 前 者 不 可 能 的 话 ， 转 发 节点 就 应 该 
能 根据 它们 路 由 的 流量 ,按照 一 定 的 计算 方法 得 到 相应 的 补偿 。 


7.5 现 有 结构 的 分 析 


在 前 面 的 讨论 中 ， 忽 略 了 对 于 网 络 攻击 的 鲁 棒 性 、 容 错 能 力 或 潜在 的 性 能 瓶 
颈 。 所 有 这 些 因素 都 会 对 中 心 化 的 方法 带 来 实际 的 挑战 ,使 节点 产生 占据 (或 逃 
离 ) 星 形 结构 中 心 位 置 的 动机 。 使 用 全 网 状 网 能 够 在 很 大 方面 上 避免 这 些 问题 ， 
但 是 就 如 我 们 已 经 看 到 的 那样 ， 全 网 状 网 仅仅 是 一 个 针对 网 络 节点 数量 适中 情况 
下 的 解决 方案 。 

目前 的 很 多 研究 工作 都 集中 在 设计 网 络 的 几何 布局 ， 以 实现 合理 的 性 能 和 解决 上 
面 提 到 的 鲁 棒 性 问题 。 在 本 节 中 ， 使 用 前 面 提出 的 代价 模型 对 一 些 路 由 几何 结构 进行 


第 7 章 CDN 的 经 济 学 设计 155 


评 佑 ， 这 些 几 何 结构 是 在 近来 的 建 网 文献 中 针对 覆盖 网 架构 提出 的 。 本 节 主 要 分 析 的 
是 de Bruijn K|, D # Torus 网 (D-dimensional Torus), PRR 树 和 Chord 环 ， 给 出 了 一 
个 节点 在 以 上 不 同 几何 结构 中 的 各 种 代价 值 。 与 前 面 一 样 ， 本 节 关 注 的 是 结果 和 结果 
背后 的 原因 ， 更 多 的 技术 细节 读者 可 以 参见 参考 文献 [11] 。 随 后 ,将 结果 与 前 面 对 
社会 最 优 和 纳什 均衡 的 研究 结果 进行 比较 。 


7.5.1 de Bruijn 图 


凭借 一 些 吸引 人 的 性 质 ， 如 短 平 均 路 由 距离 及 对 节点 失效 的 高 恢复 性 ，de Bruijn 
图 常用 于 各 种 覆盖 网 的 维护 算法 “1。 在 一 个 de Bruijn AF, ERA u 用 标识 
符 (u,，…，up) 表示 ， 其 中 符号 w，(i=1, e, D) 来 自 一 个 大 小 为 A 的 符号 表 。 
对 于 符号 表 中 的 任意 一 个 符号 x*， 从 节点 (wu, cs, uy). 出 发 有 一 条 有 向 边 连接 到 其 
他 节点 (w,，…，wub，%*)。 在 由 此 产生 的 有 向 图 中 ， 所 有 的 节点 都 有 固定 的 出 度 A, 
且 有 向 图 的 直径 为 D。 

设 六 为 一 个 节点 集 ， 其 中 每 一 个 节点 的 标识 符 具有 (h, h, e, h) 的 形式 。 由 
于 六 中 的 每 个 节点 都 有 一 条 从 自己 出 发 并 回 到 自己 的 有 向 边 ， 所 以 对 于 所 有 的 we 
V', SEP IPM, =m(A -1)。 对 于 不 在 六 中 的 节点 ww，M, = mA。 下 面 两 个 引 理 表明 ， 
每 一 个 节点 的 路 由 开销 也 依赖 于 节点 在 图 中 的 位 置 。 

引 理 1: 在 最 短路 径路 由 下 ， 节 点 weV' 并 不 路 由 任何 流量 ,， 目 R, =0。 

这 个 引 理 可 以 通过 参考 文献 [11] 的 反例 得 证 。 

引 理 2: 经 过 一 个 给 定 节 点 HBR (PARR) p, 存 在 上 界 p, SPa AP 

.(D- 1)[A"" - (aA-1)] - DA" +’ 
D max 7 fAely o 

该 边界 是 严格 的 ， 对 于 节点 (0, 1, 2, =, D -1)， 当 AzD 时 可 以 达到 该 
边界 。 

引 理 2 的 证 明 在 本 质 上 与 参考 文献 [47] 中 的 证 明 方法 相似 ， 即 限定 通过 给 定 
边 的 最 大 路 由 数量 ， 完 整 的 证 明 可 参见 参考 文献 [11] ， 在 此 简单 介绍 如 下 。 

首先 ， 确定 经 由 节点 w 的 长 度 为 的 路 径 数 的 上 界 ， 这 等 价 于 计算 长 度 为 D+ 
的 串 〈z 的 标识 符 作 为 其 子 串 ) 的 最 大 数量 。 接 着 , 在 ke [1, D] 区 间 上 对 5 求 
和 ， 并 得 到 一 个 中 间 界 ;通过 移 除 长 度 为 2D 的 所 有 串 来 进行 优化 。 长 度 为 2D RS HB 
代表 了 一 个 环 ， 而 环 不 能 确定 de Bruijn 图 中 的 最 短路 径 。 

通过 引 理 1 和 引 理 2 可 以 推出 ,在 一 个 de Bruijn 图 中 ， 对 于 任意 的 节点 u v 
ww， 有 0<Pr[y (u) =1] &p, / I o AH y, (zu) 是 一 个 二 值 函 数 ， 所 以 Pr. (0) = 
1] =Ely,.]o HARE OSR, SRo HP 

TP max 
leni 73 

FRA HEMI LAA PR, BEL, REL, BABAR SICK [11] ,节点 we 
V' 满 足 条 件 L, =La HEP 
DA"" - (D+1)A +1 
= N(A -1) 
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下 界 为 





D 
La =y DA? + D -A(A n) 


A-1 (A-1) 
且 当 4A= 刀 时 ， 对 于 节点 (0,1,--,D-1), A L, S Lue 

注意 ， 当 NW=A4A”"， 即 所 有 的 标识 符 都 已 分 配给 节点 时 ，L。。 和 工 。. 的 表达 式 可 以 
进一步 简化 。 


7.5.2 万 维 Torus 网 


fE D H Torus 网 中 ,每 一 个 节点 由 DD 个 笛 卡 尔 坐 标 表 示 ， 且 有 2D 个 邻 节点 。 对 
于 任意 节点 w， 维 护 开销 为 M, =2mD。 此 类 型 的 路 由 几何 结构 的 一 个 应 用 是 CAN! , 

每 一 个 节点 上 路 由 的 实现 方法 ， 都 是 基于 “ 贪 禁 ”的 方式 ， 即 根据 与 目标 节点 欧 
氏 距 离 最 短 的 原则 转发 到 其 邻 节点 。 这 里 假设 每 个 节点 在 D 维 空间 中 均匀 分 布 。 这 个 约 
束 也 可 以 表达 为 稍 强 一 点 的 约束 : 假设 N” 是 整数 ， 且 笛 卡尔 坐标 集 (uy cn, up) 
(其 中 每 个 都 映射 为 区 间 (0, N^ -1] 上 的 一 个 整数 ) 的 任何 一 种 取 值 都 映射 到 某 
个 节点 ， 即 假设 标识 符 空 间 (u, +, up) 完全 分 配 。 

由 参考 文献 [31] 可 知 ， 一 个 路 由 路 径 的 平均 长 度 当 N 为 偶数 时 为 (DA4) N” 
跳 ， 当 为 奇数 时 为 (PM4) N^ + D/4 -0(1). BARR D 4 Torus 网 为 均匀 分 区 ， 
由 对 称 性 可 得 : 对 于 所 有 的 uw， 使 用 与 参考 文献 [42] 相同 的 近似 ， 即 路 由 路 径 的 平 
均 长 度 在 NN 为 奇数 时 近似 等 于 (D/4)N” 跳 ， 有 
DN? 

4 


为 了 确定 路 由 开销 R,， 计 算 节 点 负载 时 将 其 作为 维 数 D HRA oL. REER D 
HE Torus 网 平均 分 区 的 假设 ， 由 对 称 性 可 知 p, sb 对 于 所 有 的 u 都 是 相等 的 。 
引 理 3: 在 一 个 充满 节点 且 节 点 数 为 NV 的 DD 维 Torus 网 中 ,任意 节点 的 负载 为 


po sie [8 soft -14 (E-A -N (7.8) 


该 引 理 的 证 明 可 以 对 维 数 D 使 用 归纳 法 " 。 首 先 ， 对 于 D =1， 在 资源 固定 分 布 
的 情况 下 ， 每 个 节点 u 的 负载 p, ,等 于 经 过 所 有 节点 的 路 由 数 之 和 。 例 如 当 N=7 时 ， 
对 于 任意 节点 uw， 有 p,, =0+1+2+2+1+0=6。 由 此 可 得 入 为 奇数 和 偶数 时 的 两 个 
不 同 的 表达 式 ， 其 一 般 化 的 形式 为 


e 7 (121-1)(21-1) 
当 D>1 时 ， 计 算 经 过 每 个 节点 的 路 由 数 p, ,的 关键 在 于 ， 因 为 一 条 路 径 上 
的 两 个 相 邻 节点 的 坐标 差异 不 会 超过 一 个 维度 ， 所 以 沿 着 笛 卡 尔 坐 标 系 存 在 着 若 
干 条 等 效 的 最 短路 径 。 例 如 对 于 D=2， 从 节点 (0,0) 到 节点 (1, 1): A=(0, 
0) 一 (1,0) 一 (1,1) 和 号 =(0,0) 一 (0,1) 一 (1,1) 是 等 效 的 最 短路 径 。 因 此 ， 总 是 
能 够 选择 一 条 以 正确 的 顺序 改变 坐标 的 路 径 一 一 从 第 一 维 坐标 开始 变化 ， 也 就 是 上 
AHN A. 





L,=1 
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Ro 为 路 由 的 起 始 节点 ，vw AAD, Wu, v, w 的 坐标 分 别 用 (u,, =, 
Up). (%, c, Up) Al (w,, «+, w) 表示。 根据 路 由 算法 ， 中 间 节 点 w 每 次 改正 
一 个 坐标 时 仅 有 3 种 可 能 : 节点 与 源 节点 v 和 目标 节点 w 具有 相同 的 第 D. HEAR 
tr, Blu, =zp =w; QA u, v 和 w 的 第 D 维 坐 标 均 不 相同 ， 即 uow; 图 节 
点 和 节点 v 具 有 同样 的 第 D 维 坐 标 , 但 与 目标 节点 w AR, Blu, v5, upz wp, Ñ 
过 计算 每 一 种 情况 的 节点 负载 并 求 和 ， 可 得 式 (7.8) P p, WE. 

对 于 所 有 的 节点 ww， 通过 pp 可 以 立刻 得 到 


7.5.3 PRR 树 


下 面 分 析 PRR 树 的 变种 ” ， 其 应 用 可 参见 Pastry" z& Tapestry ^, HARRA 
以 A AEH DARF (u, +, wp)。 对 于 i=1…D 且 xzue10,…, A-1}, 
S— B SUBE (Qu, rts nas X, Viss s Y» 的 形式 连接 到 D(A -1) 个 不 同 
的 邻 节 点 ， 此 时 维护 开销 为 M, 2 mD (A-1), 

对 于 余下 坐标 y; ,, ，…，Yyo 的 各 种 可 能 取 值 ， 协 议 一 般 会 通过 一 个 邻近 度 (prox- 
imity metric) 来 选择 一 个 附近 的 节点 。 假 设 节点 在 空间 中 的 分 布 是 均匀 的 ， 且 所 有 标 
识 符 已 全 部 分 配 ， 则 可 以 选择 y;,, uu, cn, yp = up。 这 样 ， 相 隔 距 离 为 n 跳 的 两 
个 节点 和 ww 在 坐标 中 相差 n 个 数 。 


D 
显然 ， 有 | ，] 种 不 同 的 方式 来 选择 差异 出 现在 哪些 数 ， 而 且 每 个 差异 的 数 都 有 
A -1 个 可 能 的 取 值 。 因 此 ,对 于 一 个 给 定 节点 u， 与 之 相隔 距离 为 n 的 节点 有 
pju- 再 乘 以 节点 的 总 数 N=A?， 并 除 以 路 径 总 数 六， 可 以 推出 : 对 于 所 


有 wu、v、w， 有 


We 
Pr[t, ,=n] (7.9) 
对 于 任意 两 个 满足 =n 的 节点 w、v， 因 为 路 由 是 唯一 的 ， 所 以 在 w 和 vw 之 间 
的 路 径 上 存在 n -1 个 不 同 的 节点 。 因 此 ， 随 机 抽取 一 个 节点 w， 它 位 于 w Bo 的 路 径 
上 的 概率 为 


有 一] (7. 10) 
N 


对 式 (7.9) 和 式 (7.10) 使 用 全 概率 公式 ， 将 等 号 右边 表示 为 展开 式 的 导数 的 
函数 ， 结 合 Pr[x,,(w) =1] 并 使 用 二 项 式 定理 ， 然 后 乘 以 "， 可 得 路 由 开销 


| (7.11) 


N 





Prly,,,(w) =11t,, =n] = 


158 内 容 分 发 网 络 





使 用 式 (7.9) 中 给 出 的 Br [tn] 并 利用 二 项 式 定理 ”， 访问 开销 工 ,为 


DA" (A -1) 


N (7. 12) 


L, = lE[t,,] = 1%, erie, =n] =1 
注意 ,对 于 入 =A”, xt (7.12) 退化 为 L,=1D (A-1) ZA, 
7.5.4 Chord 3^ 


在 一 个 Chord Fh, WAAR ZA (BIA =2) 。 当 环 的 全 部 标识 符 完全 分 
配 时 ， 每 个 节点 必 与 刀 个 邻 节 点 相连 ， 这 些 邻 节点 的 标识 符 为 [ (wu +2”) mod 2^], 
其 中 p=0，…, 也 -1。 与 对 PRR 树 的 分 析 类 似 [ 式 (7.11) MH (7.12)]， 可 得 
RAIL, (A22 时 ) 。 仿 真 结果 验证 了 本 节 的 分 析 扩 : 。 


7.5.5 讨论 


本 节 的 分 析 结 果 可 以 用 于 很 多 情况 。 首 先 ， 这 些 结果 表明 ， 本 节 中 提 及 的 各 种 路 
由 几何 结构 都 具有 同样 的 渐 近 特性 : 路 由 开销 以 logN 的 数量 级 下 降 ， 延 时 开销 以 
log 的 数量 级 增长 。 其 次 ， 虽然 这 些 渐进 性 众所周知 (参见 参考 文献 [22, 31, 42, 
48] ) ,但 本 节 博 弈 论 分 析 的 主要 优点 在 于 能 提供 闭 式 的 方程 ， 可 以 在 实际 应 用 中 根 
据 对 不 同 开销 (如 路 由 开销 和 延 时 开销 ) .的 相对 偏重 ,调整 配置 参数 A 或 D。 第 三 ， 
本 节 的 分 析 提 供 了 一 个 基线 ， 用 于 与 以 下 方面 进行 比较 : 中 社会 最 优 和 (或 ) 纳什 
均衡 ;四 一 些 更 实际 的 网 络 状况 ， 如 网 络 中 标识 符 空 间 稀 朴 分 配 或 者 节点 中 的 某 些 资 
源 需 求 相 对 更 大 。 这 些 对 比分 析 构 成 了 下 一 节 的 内 容 。 


7.6 定量 评估 


本 节 使 用 蒙特 卡 洛 仿真 对 上 述 不 同 网 络 结构 的 分 析 结 果 进 行 比较 。 男 外 ， 上 面 的 
分 析 中 使 用 了 一 些 假设 ， 如 所 有 资源 都 具有 相同 的 访问 几率 、 标 识 符 全 部 分 配 。 本 节 
将 放宽 这 些 约定 ， 对 放宽 后 的 影响 进行 定量 的 分 析 ， 使 上 节 的 分 析 更 加 完善 。 

1 与 社会 最 优 进行 比较 

首先 给 出 7. 5 节 的 数值 分 析 结 果 。 如 表 7.2 所 示 ， 给 出 了 5 个 具有 不 同 A 和 D X 
值 的 de Bruijn 图 ， 且 请 求 源 式 和 被 请 求 资源 了 为 相互 独立 的 服从 均匀 分 布 的 随机 变 
量 。 从 表 中 的 数据 可 以 看 出 ， 当 所 有 节点 的 延 时 开销 相差 不 大 时 ，R。.. 和 次 优 情 况 下 
的 路 由 开销 R', 的 比值 一 般 较 大 。 因 此 ， 如 果 r >> !， 则 那些 R, = Rs. 的 节点 可 能 会 
存在 “ 换 座 ”的 动机 。 例 如 ， 这 些 节 点 可 能 会 离开 网 络 ， 然 后 再 很 快 回来 ， 希 望 能 
被 分 配 一 个 不 同 的 标识 符 uw' 关 w， 以 减轻 自己 的 负载 。 这 就 可 能 需要 增加 一 些 机 制 ， 
如 增加 一 个 进入 网 络 的 成 本 ,来 避免 节点 的 这 种 离开 行为 。 


〇 ” 即 除 集合 V 中 4 个 节点 外 的 所 有 其 他 节点 的 R 的 最 小 值 (对 于 VY 中 的 节点 ，R, =0)。 一 一 原 
书 注 
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表 7.2 de Bruijn 图 中 开销 的 不 对 称 性 (1=1, r=1 000) 





现在 对 上 述 不 同 网 络 几何 结构 下 的 开销 进行 了 仿真 。 选 择 A =2， 此 条 件 对 PRR 
树 和 Chord 环 的 效果 是 完全 相同 的 。 对 D 维 Torus 网 ， 选 择 D = |12，6} ， 对 其 他 几何 
结构 选择 D = log, No 

在 仿真 中 ， 节 点 数量 在 N=10 到 N=1 000 之 间 变 化 。 对 每 一 个 入 的 取 值 ， 以 不 
同 的 种 子 值 进 行 10 次 蒙特 卡 洛 仿真 ， 每 次 包含 100 000 个 请 求 ， 且 参数 使 用 不 同 的 
值 ，X 和 了 为 相互 独立 服从 均匀 分 布 的 随机 变量 。 对 所 有 的 请 求 和 节点 求 平均 ， 得 到 
的 延 时 开销 和 路 由 开销 如 图 7.2 所 示 。 


20 








100 200 300 400 500 600 700 800 900 1000 i 100 200300 400 500 600700800 900 1000 


节点 数 
a) b) 


图 7.2 ” 延 时 开销 和 路 由 开销 
a) 延 时 开销 (1=1) b) 路 由 开销 (r=1, 000) 
QE: 标 有 sim 的 曲线 表示 仿真 结果 ， 由 于 全 网 状 网 的 延 时 开销 恒 为 1， 
路 由 开销 恒 为 0， 故 这 两 项 结果 因 显 示 问 题 在 图 中 略 去 ) 

由 图 7.2 可 知 ， 星 形 网 络 的 平均 开销 较 其 他 几何 结构 低 ， 这 与 之 前 的 分 析 相 吻 
合 ， 即 在 很 多 情况 下 星 形 网 络 都 是 社会 最 优 的 。 但 需要 注意 的 是 ， 本 节 的 代价 模型 并 
未 考虑 扩展 性 或 者 恢复 性 因素 ， 而 这 两 个 因素 都 是 完全 中 心 化 的 结构 中 需 重点 考虑 的 
因素 。 另 外 ， 虽 然 星 形 网 络 是 潜在 的 纳什 均衡 ， 但 仍 需要 一 定 的 激励 机 制 〈 如 货币 
奖励 ) 来 对 星 形 网 络 中 存在 的 节点 开销 不 对 称 问题 进行 补偿 ， 并 鼓励 一 个 节点 在 第 
一 步 就 去 占据 中 心 位 置 。 

2. 资源 访问 的 不 对 称 性 

下 面 将 验证 把 “所 有 资源 都 具有 相同 的 访问 几率 ”这 一 假设 放宽 后 ， 对 之 前 分 
析 结 果 的 影响 。 为 此 进行 了 一 组 仿真 ， 受 参考 文献 [7] 的 启发 ， 仿 真 中 假设 用 户 对 
资源 的 访问 模式 服从 Zipf - like 分布 。 

在 这 组 蒙特 卡 洛 仿真 中 ， 网 络 的 节点 数 设 定 为 V=512。 对 于 D HE Torus 网 ， 选 择 
D-3; 对 于 其 他 几何 结构 的 网 络 ， 选 择 A =2 和 D =9。 仿 真 运 行 了 1024 次 ， 每 次 包 
含 100 000 个 请 求 。 请 求 源 不 是 服从 均匀 分 布 的 随机 变量 ， 被 请 求 的 资源 了 服从 
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Zipf - like 分 布 ， 有 

S, =sQ/{ Rank(u) ]* 
sth, a20.75, QS (XXn) ^, Rank: Vo{1, =, N} 是 一 个 双 射 函数 ， 根 据 节 
点 持 有 给 定 资源 的 概率 ， 对 节点 we VV 按照 概率 递减 的 原则 给 出 4 的 排序 值 。 

因为 了 不 再 是 一 个 服从 均匀 分 布 的 随机 变量 ， 因 此 不 同 的 节点 具有 不 同 的 延 时 开 
销 和 路 由 开销 。 在 每 一 个 试验 中 ， 对 所 有 节点 计算 了 延 时 开销 和 路 由 开销 的 最 大 值 
(LER) 和 最 小 值 (Loin fA Rein) 之 间 的 比率 。 在 de Bruijn 图 中 ， 因 为 有 些 节点 
并 不 路 由 任何 流量 ， 所 以 再 次 令 R';, min, |R,>0|。 

在 表 7.3 中 显示 了 1024 次 试验 的 平均 比率 Lu / Lu RR RLUS 括号 中 的 数 表 示 标 
准 差 。 结 果 表 明 ， 对 于 任何 几何 结构 ， 所 有 节点 上 的 延 时 开销 比较 相似 ， 但 路 由 开销 则 
有 显著 的 差异 。 在 de Bruijn 图 中 更 高 的 不 对 称 性 可 以 通过 节点 负载 的 差异 来 解释 (S 
见 7.5 节 ) ， 因 为 节点 负载 的 差异 放大 了 路 由 开销 的 差异 。 与 社会 最 优 相 比 ， 在 星 形 网 
络 或 者 全 网 状 网 中 ， 路 由 开销 和 延 时 开销 相似 ， 而 与 不 同 资源 的 受 欢迎 程度 无 关 。 

表 7.3 当 资 源 请 求 概率 服从 Zipf -like 分 布 时 ， 网 络 中 开销 的 不 对 称 性 


f R 
Lain iin 
















1.2675 ( x0.0442) 5.2845 ( +0. 3516) 


30.7275 ( +9. 5970) 
9.2154. ( +0. 6590) 

下 面 确定 路 由 开销 中 的 不 对 称 性 是 否 对 延 时 开销 〈 即 服务 开销 ) 中 的 不 对 称 性 
实现 了 补偿 。 为 此 ， 本 节 分 别 计算 了 R 与 L、R 与 $ 及 L 与 S 之 间 的 相关 系数 (对 于 
两 个 变量 x Aly, eA Corr (x, y)), 计算 数据 包括 可 用 于 三 元 组 (R, L, S) 的 512 
个 节点 x1 024 次 试验 =524 288 个 数据 点 ， 计 算 结果 见 表 7.4。 从 表 7.4 可 以 看 出 ， 
对 于 这 三 种 几何 结构 ，5 与 RR 之 间 及 5 与 也 之 间 几 乎 不 存在 相关 性 。 换 句 话说， 服 
务 开销 对 RR 或 L 几乎 没有 影响 。R 和 工 之 间 的 相关 度 也 非常 低 ， 表 明 不 同 的 节点 可 能 
最 终 会 具有 完全 不 同 的 开销 。 

对 于 这 3 种 路 由 几何 结构 ， 资 源 请 求 的 非 对 称 性 可 能 会 导致 不 同 节 点 存在 完全 不 
同 的 开销 。 开 销 的 差异 导致 一 些 节 点 会 过 载 ， 或 者 至 少 会 使 节点 产生 很 强 的 动机 先 离 
开 然 后 再 重新 加 入 网 络 ， 以 便 能 得 到 一 个 “更 好 的 位 置 ” 。 这 个 结果 强调 了 ， 如 果 
CDN 使 用 的 协议 取决 于 某 个 上 述 的 路 由 几何 结构 ， 那 么 就 必须 意识 到 协议 中 具有 高 
效 的 负载 均衡 原型 的 重要 性 。 

表 7.4 资源 访问 服从 Zipf - like 分 布 的 网 络 中 路 由 、 延 时 和 服务 开销 之 间 的 相关 性 

- 0. 3299 -0.0112 


- 0. 2278 - 0. 0128 
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de Bruijn 








O MARAN LP MUA EAT, AREE ER HE (UNE CR p WRAKI) 来 确定 两 
个 变量 之 间 不 存在 相关 性 。 这 里 不 再 进行 此 类 测试 ， 需 要 说 明 的 是 ， 附 加 数据 (如 散布 图 ) 可 以 确定 变量 
之 间 不 存在 相关 。 一 一 原 书 注 
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3. MIRA SABRD Be 

至 此 ， 本 文 一 直 假设 标识 符 空间 是 完全 分 配 的 。 例 如 ， 在 一 个 PRR 树 中 ， 如 果 A = 
2, D=9 则 必然 包含 N=512 个 节点 。 而 事实 上 ， 标 识 符 空 间 有 可 能 是 稀疏 分 配 的 。 

在 下 面 的 仿真 实验 中 ， 对 于 每 一 种 几何 结构 ， 本 文 使 用 固定 数量 的 节点 W=512。 
首先 ， 从 完全 分 配 的 标识 符 空 间 开 始 进 行 仿真 。 对 于 de Bruijn 图 和 PRR fj, iA = 
2、D =9， 并 逐步 增加 D 直到 D=15。 对 于 D 维 Torus W, 令 D=3， 使 每 个 节点 都 
由 一 组 坐标 (wu,，w,，u,) 表示 ， 其 中 每 个 坐标 wu,、u, 和 ,的 取 值 都 在 0 到 之 间 。 
开始 ， 选 择 n=8 使 任何 一 组 坐标 都 对 应 于 一 个 给 定 节点 (AA n = W) 。 接 着 ， 逐 步 
增加 直到 n=32， 即 对 于 所 有 的 三 种 拓扑 结构 ， 标 识 符 空间 中 的 标识 符 数 从 512 增 
加 到 32768 个 。 最 初 没 有 映射 到 任何 节点 的 那些 标识 符 用 一 个 服从 均匀 分 布 的 随机 变 
量 来 进行 选择 。 对 于 D 的 每 一 个 取 值 (分 别 对 应 于 的 所 有 取 值 ) ， 使 用 不 同 的 随机 
种 子 进 行 100 次 Monte Carlo 仿真 实验 ， 对 应 于 标识 符 的 100 种 不 同 的 分 配方 式 。 每 一 
个 实验 包括 100000 个 请 求 ， 实 验 中 蕊 和 了 是 相互 独立 服从 均匀 分 布 的 随机 变量 。 

对 于 每 一 种 几何 结构 ， 图 7.3 中 给 出 了 由 100 次 实验 (对 应 于 一 个 给 定 的 标识 符 
个 数 ) 结果 计算 出 的 比率 RAR 、Feas/Ea 和 Me.LMe 的 均值 ， 以 及 这 三 个 比率 在 
最 坏 情 况 〈 即 最 大 值 ) 下 的 值 。 


Rmax /R ‘min 





oki e RE ee E; 1 
512 1024 2048 4096 8192 16384 32768 512 1024 2048 4096 8192 16384 32768 
标识 符 数 标识 符 数 
Rmax/R’'min Lmax / Lmin 


Mmax / Mmin 
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512 1024 2048 4096 8192 16384 32768 
标识 符 数 
Mmax / Mmin 


图 7.3 使 用 不 同 个 数 的 标识 符 时 ， 一 个 给 定 节点 的 路 由 、 
延 时 及 维护 开销 的 最 大 值 与 最 小 值 之 间 的 比率 
( 注 : 标 有 “avg. ”的 曲线 表示 给 定 集 上 所 有 实验 的 平均 结果 ， 
而 标记 “w. c. ”表示 最 坏 情况 ， 即 最 大 比率 ) 
实验 结果 显示 ， 在 一 个 稀疏 分 配 的 标识 符 空间 中 ， 延 时 开销 的 不 平衡 性 保持 相对 
温和 (因子 值 在 3 ~4 左右 ) ; 而 维护 开销 的 不 平衡 性 表现 得 较为 明显 ( 从 最 高 到 最 
低 时 相应 的 比率 在 20 ~25 左右 ) 。 最 主要 的 发 现 是 ， 路 由 开销 的 不 平衡 性 可 能 会 变 得 
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非常 大 ， 从 最 好 到 最 坏 情况 时 比率 在 几 百 到 几 千 之 间 变 化 。 这 个 结果 强调 了 对 高 效 负 
载 均衡 路 由 算法 的 迫切 需求 ， 如 果 没 有 这 样 的 路 由 算法 ， 那么 大 量 的 节点 可 能 会 有 这 
样 的 强烈 冲动 : 离开 网 络 并 随即 重新 加 入 网 络 ， 以 换 到 一 个 更 好 的 位 置 ， 这 就 导致 了 
不 稳定 性 的 存在 。 

此 外 ， 实 验 结果 还 表明 ， 标 识 符 空间 的 稀 玻 分 配 会 使 各 种 不 同 的 开销 之 间 变 得 相 
关 !…] 。 这 个 结果 印证 了 之 前 的 猜测 ， 即 一 个 给 定 节点 的 路 由 和 延 时 开销 很 大 程度 上 取决 
于 节点 与 网 络 中 其 他 节点 之 间 连 接 的 好 坏 程度 ， 而 这 恰恰 又 是 通过 维护 开销 来 体现 的 。 


7.7 与 给 使 用 者 


到 目前 为 止 ， 在 对 CDN 中 相关 各 方 的 理性 行为 进行 建 模 时 ， 纳 什 均衡 被 认为 是 
一 个 非常 适合 的 工具 ， 其 主要 优点 在 于 它 的 简单 性 。 不 过 ， 纳 什 均衡 对 每 个 博弈 参与 
者 的 能 力 和 目标 施加 非常 严格 的 假设 ， 使 其 能 够 预测 那些 与 直 党 或 现实 相悖 的 结果 。 
特别 是 ， 一 般 认为 理性 参与 者 应 该 能 做 出 正确 的 决策 、 对 博弈 具有 完美 的 预测 以 及 无 
限 的 计算 能 力 。 从 直觉 上 说 ， 网 络 参 与 者 可 能 会 偏离 上 述 严 格 的 假设 : 对 于 网 络 用 户 
来 说 ， 他 们 不 可 能 具备 非常 高 的 理性 ; 又 如 自动 代理 ， 它 们 则 可 能 会 由 于 软件 缺陷 、 
配置 不 正确 或 计算 资源 的 不 充分 等 原因 而 出 现 故障 。 

因此 ， 有 充分 的 理由 来 给 出 更 一 般 化 的 策略 行为 模型 ， 而 将 纳什 均衡 的 概念 作为 
其 特例 。 特 别 是 ， 为 了 放宽 纳什 均衡 所 要 求 的 “完全 理性 ”这 一 假设 ， 有 人 提出 了 
有 限 理性 (bounded rationality) 的 概念 。 有 限 理性 的 参与 者 在 整个 决策 空间 中 不 需要 
选择 最 好 的 策略 ， 而 是 允许 在 很 多 方面 上 出 现 误差 ， 如 评估 与 一 个 策略 相关 的 收益 、 
评价 最 优 可 用 策略 或 对 某 个 策略 的 执行 等 方面 。 

目前 存在 很 多 不 同 的 技术 对 有 限 理性 进行 建 模 。 一 个 方法 是 将 〈 可 能 是 少量 的 ) 
噪声 引入 到 制定 决策 的 过 程 中 (如 参考 文献 [21] ) 。 另 一 种 有 限 理性 的 均衡 模型 是 
随机 最 优 反应 均衡 (Quantal Response Equilibrium" ，QRE) 。 如 果 用 户 计 算 给 定 策略 
的 相关 收益 时 存在 着 误差 ， 则 可 以 使 用 QRE 对 博弈 中 均衡 的 特性 进行 分 析 。 

也 许 最 简单 的 松弛 方法 就 是 近似 理性 (near rationality), i e - 均衡 的 概 
a), e -均衡 是 将 一 个 完全 理性 参与 者 的 概念 放宽 得 到 这 样 的 一 个 模型 : 在 该 模型 
中 每 一 个 参与 者 满足 于 接近 (不 必 取 得 ) 对 其 他 参与 者 策略 的 最 优 响 应 ， 一 个 参与 
者 不 论 采取 什么 其 他 策略 ， 其 效用 的 提高 也 不 会 超过 。 (es >0) 。 这 样 ， 通 过 确定 每 
个 参与 者 的 策略 来 找到 一 个 e -均衡 ,使 得 在 给 定 其 他 参与 者 的 策略 时 ， 一 个 参与 者 
的 收益 与 其 最 大 可 能 收益 的 差 不 超 过 e。 

定义 4: 如 果 对 于 所 有 的 ie N、o, eX 及 一 个 固定 大 小 的 as>0,， fiu, (a, 
oi) -u; (of, a^) <e， 则 混合 策略 向 量 g = (o, =, oy) EY WMP 
G 的 混合 策略 e -均衡 。 

如 果 一 个 纯 策略 的 向 量 * eZ 满足 上 述 均衡 条 件 ， 那 么 它 就 构成 一 个 纯 策 略  - 
均衡 。 当 se =0 时 ， 就 退化 为 纳什 均衡 这 个 特例 。 这 样 ， 可 以 将 e - 均衡 视 为 竞争 均 
衡 的 一 个 更 一 般 化 的 解 。 
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如 之 前 的 命题 4 和 命题 5 所 示 ， 如 果 只 考虑 纳什 均衡 ， 则 当 参 数 m、! 和 设 定 
为 一 定 的 取 值 组 合 时 ， 星 形 网 络 或 全 网 状 网 最 有 可 能 实现 纳什 均衡 。 由 纳什 均衡 扩展 
到 s -均衡 ， 如 果 有 me [/N-e, LN+e]， 则 无 论 网 络 拓扑 结构 为 何 均 可 以 构成 
一 个 -均衡 。 该 结论 的 证 明 并 不 复杂 ， 只 需 简单 地 将 e 加 入 到 命题 4 和 命题 5 的 证 
明 中 即 可 。 另 外 ， 有 损 信 道 等 原因 会 导致 网 络 连接 的 失效 。 如 果 节 点 为 解决 该 问题 而 
使 用 混合 策略 而 不 是 纯 策略 ， 那 么 若 想 使 得 任何 网 络 都 是 一 个 6 -均衡 ,估计 m 的 可 
能 取 值 范围 要 比 2e 大 得 多 。 

2. 实际 应 用 问题 

在 均衡 概念 本 身 存 在 着 不 确定 性 的 情况 下 ， 将 博弈 论 应 用 到 CDN 设计 可 以 得 到 
多 少 好 处 呢 ? 

首先 ， 姑 且 不 论 均衡 的 概念 ， 社 会 最 优 分 析 对 于 理解 网 络 性 能 的 上 限 是 至 关 重 要 
的 。Papadimitriou 定义 了 一 个 有 意思 的 性 能 测度 ， 称 之 为 无 政府 的 代价 (price of anar- 
chy) ”。 无 政府 的 代价 是 纳什 均衡 在 最 坏 情况 下 的 总 效用 也 C, 与 社会 最 优 的 比率 ， 
作为 系统 设计 时 一 个 有 用 的 度量 ， 它 可 以 显示 出 在 参与 者 各 自 为 政 的 情况 下 性 能 到 底 
可 以 降低 到 什么 程度 。 

其 次 ， 尽 管 存 在 严格 的 假设 ， 纳 什 均衡 仍 不 失 为 一 个 非常 有 用 的 工具 ， 可 以 作为 
个 体 动机 的 一 个 一 阶 近似 。 特 别 地 ， 在 纳什 均衡 中 参与 者 的 行为 会 导致 最 坏 情 况 的 发 
生 ， 这 就 有 助 于 设计 者 通过 分 析 获 得 网 络 性 能 的 下 界 。TCP 拥塞 控制 的 例子 可 以 证 明 
纳什 均衡 可 能 是 一 个 最 坏 情 况 下 的 均衡 : 在 一 个 TCP/IP 网 络 中 ， 如 果 那 些 竞争 带宽 
的 参与 者 达到 了 一 个 纳什 均衡 ， 那 么 它们 都 会 关闭 拥塞 控制 (或 使 用 UDP)”, {A 
际 情况 远 远 不 是 这 样 ， 因 为 大 多 数 用 户 还 是 乐于 不 修改 其 TCP 参数 ， 这 可 以 用 有 限 
理性 的 观点 来 解释 。 

再 有 ,使 用 近似 理性 (而 不 是 完全 理性 ) 可 以 有 助 于 评估 一 个 博弈 模型 的 精度 。 如 果 
模型 缺乏 鲁 棒 性 ， 那 么 它 成 为 现实 情况 下 一 个 精确 模型 的 机 会 就 会 降低 。 在 上 述 例子 中 可 
以 看 到 ， 输 出 不 确定 结果 的 参数 空间 随 着 不 确定 量 e 而 线性 增长 ， 这 表明 模型 足够 鲁 棒 ， 
也 很 可 能 是 可 靠 的 。 另 外 ， 其 他 的 一 些 非 组 网 的 例子 "并 没有 显示 出 这 种 性 质 。 


7.8 未 来 研究 方向 


本 章 讨论 的 是 应 用 博弈 论 对 覆盖 网 (如 CDN) 中 的 交互 进行 建 模 。 不 过 ， 用 经 
济 学 原理 指导 网 络 设计 并 不 限于 博弈 论 ， 更 一 般 化 的 方法 是 对 网 络 中 个 体 动机 的 研 
究 。 因 此 ， 这 个 研究 领域 将 来 应 该 会 继续 保持 活力 。 

在 短期 内 ， 本 章 的 研究 成 果 估 计 会 有 助 于 开发 出 更 精致 成 熟 的 动机 型 。 什 得 注意 
的 是 ， 近 来 系统 设计 方面 越 来 越 多 的 文献 "155 利用 了 经 济 学 原理 来 构建 其 方案 。 

更 明显 的 趋势 是 ， 考 虑 到 内 容 分 发 市 场 的 快速 发 展 、 设 施 提供 商 之 间 激 烈 的 竞争 
以 及 潜在 的 微薄 利润 ，CDN 的 设计 者 为 了 确保 收益 将 不 得 不 更 好 地 理解 市 场 的 力量 
和 个 体 的 动机 。 

另 一 个 潜在 的 研究 方向 是 通过 对 动机 的 研究 来 加 强 CDN 的 安全 性 。 例 如 ， 参 考 
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文献 [29] 显示 ， 通 过 重 构 现 有 的 技术 来 实现 对 存在 着 分 歧 的 个 体 动 机 进行 重组 ， 
可 以 建立 一 个 安全 性 更 高 的 覆盖 网 ， 帮 助 那些 处 于 潜在 竞争 的 内 容 提 供 商 提高 面 对 
DDoS 攻击 时 的 网 络 恢复 能 力 。 

这 个 研究 预示 了 一 个 令 人 感 兴趣 的 趋势 : 之 前 面临 的 问题 已 经 完全 不 同 了 。 未 来 的 
系统 不 再 试图 解决 动机 协调 的 问题 ， 而 是 可 能 会 深入 研究 各 种 动机 之 间 的 差异 ， 从 而 通 
过 让 不 同 的 实体 在 网 络 中 充当 最 适合 它们 自身 目标 的 角色 ， 来 实现 更 优 的 系统 设计 。 


7.9 结论 


基于 负载 和 节点 连通 性 ， 本 章 提出 了 一 个 代价 模型 ， 用 来 解决 一 个 覆盖 网 (如 
CDN) 中 的 节点 开销 问题 。 这 个 代价 模型 对 于 不 同 网 络 拓扑 性 能 的 测量 是 一 个 有 用 的 
补充 ， 因 为 它 一 揽 子 地 实现 了 以 下 目标 : 预测 妨碍 协作 的 因素 ( 即 节 点 为 了 降低 开 
销 而 拒绝 对 请 求 进行 服务 ) 、 发 现 可 能 的 网 络 不 稳定 性 〈 即 节点 为 了 降低 开销 而 离开 
或 重新 加 入 网 络 ) 、 识 别 热点 〈 具 有 高 路 由 负载 的 节点 ) 及 描述 一 个 网 络 的 效率 。 

前 面 说 过 ， 一 个 节点 为 其 他 节点 转发 流量 时 会 占用 其 自身 的 资源 。 本 章 的 一 个 关 
键 结论 是 ， 如 果 节 点 很 在 乎 这 些 被 占用 的 资源 ， 就 可 能 会 产生 低 效 问题 。 在 这 种 情况 
下 ， 让 节点 根据 自己 的 意愿 来 选择 保持 哪些 网 络 连接 ， 那 么 对 于 整个 资源 的 使 用 来 说 
就 能 得 到 一 个 次 优 网 络 。 

分 析 还 显示 ， 必 须 设 计 非 常 有 效 的 负载 均衡 原 语 来 避免 节点 之 间 开 销 的 不 平衡 ， 
以 消除 这 种 不 平衡 给 网 络 带 来 的 潜在 不 稳定 性 。 除 了 负载 均衡 原 语 机 制 ， 一 个 可 能 的 
选择 是 动机 机 制 ， 它 使 节点 乐于 转发 尽 可 能 多 的 网 络 流量 。 本 章 给 出 的 有 关 博 弈 论 的 
公式 有 助 于 激励 相 容 的 设计 。 

最 后 ， 本 章 提出 的 框架 可 以 帮助 一 个 CDN 的 设计 者 确定 哪 一 类 拓扑 结构 更 适 于 
所 处 的 特定 环境 ， 如 在 ad - hoc 网 上 的 内 容 分 发 、 视 频 点 播 等 。 这 个 努力 将 成 为 一 种 
尝试 ， 即 参数 化 地 评估 各 种 拓扑 之 间 相 对 的 标 称 开销 。 
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8 CDN 的 定价 


Kartik Hosanagar 
8.1 引言 


CDN 是 内 容 分 发 供应 链 的 一 个 重要 组 成 部 分 。 这 个 供应 链 包 括 创建 内 容 的 内 容 
提供 商 、 骨 干 网 、 用 来 传输 内 容 的 接 人 网 络 以 及 那些 存储 信息 并 将 信息 从 网 络 边缘 分 
发 到 网 络 终端 用 户 的 CDN 提供 商 。 通 过 在 网 络 边缘 附近 实现 服务 器 的 同 地 协作 (co 
-locating) ，CDN 在 这 个 利益 链 上 具有 独特 的 地 位 ， 因 此 被 互联 网 中 大 量 的 主要 内 容 
提供 商 使 用 。 随 着 越 来 越 多 的 人 使 用 宽带 ， 加 上 内 容 分 发 不 断 向 多 媒体 方向 发 展 ， 
CDN 将 在 互联 网 的 媒体 分 发 中 扮演 越 来 越 重 要 的 角色 。 

CDN 给 内 容 提 供 商 带 来 了 明显 的 经 济 利益 。 通 过 在 网 络 边缘 处 分 发 内 容 ，CDN 
使 网 络 内 容 的 分 发 更 加 迅捷 。 不 仅 如 此 ，CDN 可 以 通过 整合 多 个 用 户 站 点 的 流量 ， 
在 网 络 设施 成 本 方面 实现 规模 经 济 效益 。 因 此 ，CDN 内 容 分 发 的 边际 成 本 将 远 远 小 
于 那些 只 在 自己 专 有 网 络 上 进行 内 容 发 布 的 小 内 容 提供 商 。 流 量 的 整合 也 降低 了 用 户 
对 内 容 的 需求 差异 所 带 来 的 压力 。 一 般 来 说 ,不同 内 容 提供 商 传输 内 容 时 的 流量 不 会 
在 同一 时 刻 达 到 峰值 ， 所 以 困扰 单个 内 容 提供 商 的 突 发 性 流量 峰值 问题 可 以 通过 增加 
其 CDN 设施 来 解决 。 最后， 由 于 CDN 可 以 使 用 多 台 备 选 服务 器 提供 服务 ， 所 以 单个 
节点 一 般 不 会 成 为 瓶颈 ， 这 就 有 助 于 改善 内 容 的 可 用 性 ， 特 别 是 在 瞬时 拥塞 和 遭 到 
DoS 攻击 的 时 候 。 

与 此 同时 ，CDN 在 设施 的 维护 和 内 容 分 发 上 也 会 带 来 成 本 问题 。 考 虑 到 CDN 引 
人 和 的 成 本 和 内 容 提 供 商 可 能 获得 的 巨大 收益 ， 需 要 一 个 市 场 机 制 来 保证 不 仅 内 容 提供 
商 能 够 继续 获得 收益 ，CDN 提供 商 也 要 有 部 署 和 管理 其 设施 的 积极 性 。 最 简单 的 机 
制 就 是 给 CDN 服务 定价 ， 这 就 是 本 章 的 关注 焦点 。 

CDN 定价 问题 已 在 业内 得 到 了 相当 大 的 关注 。 定 价 策略 明显 影响 到 CDN 提供 商 
和 内 容 提供 商 的 利润 ， 各 方 关注 的 问题 包括 突 发 流量 对 定价 和 收益 的 影响 ”、 当 前 定 
价 方案 中 使 用 的 总 量 折扣 ?和 超额 问题 "以 及 竞争 和 价格 战 对 CDN 市 场 的 影 
nga, 

随后 的 各 节 安 排 如 下 : 首先 对 业界 常用 的 定价 模型 进行 回顾 ; 随后 ， 介 绍 包括 
CDN 定价 在 内 的 一 些 对 内 容 分 发 市 场 经 济 效益 的 学 术 研究 ; 168.3 节 中 给 出 了 一 个 模型 ， 


© “总 量 折扣 (volume discount) 是 指 ， 如 果 消 费 者 的 购买 数量 达到 某 个 约定 值 ， 则 全 部 商品 CIR 
于 超额 折扣 中 的 超额 部 分 ) 按 约定 的 折扣 计价 。 例 如 ， 衬 衫 单价 100 元 ， 而 一 次 购买 3 件 的 价格 
为 240 元 。 一 一 译 者 注 
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用 于 分 析 内 容 提供 商 从 CDN 服务 中 获得 的 收益 ， 并 使 用 该 模型 研究 定价 策略 ; 接 下 
的 章节 将 对 行业 中 的 参与 各 方 进行 分 析 ; 最 后 ， 提 出 未 来 的 研究 方向 和 本 章 的 结论 。 


8.2 业界 常用 的 定价 模型 


CDN 使 用 了 很 多 不 同 的 定价 模型 ， 这 些 模型 都 有 其 独到 之 处 。 下 面 简要 介绍 两 
个 最 流行 的 定价 模型 。 


8.2.1 基于 总 量 的 定价 


最 简单 的 定价 方法 是 针对 流量 达到 某 个 特定 级 别 的 内 容 提 供 商 (如 每 月 50TB ) 。 
基于 约定 的 不 同 流量 级 别 ，CDN 按照 每 GB 设 定价 格 。 这 些 定 价 方案 通常 提供 一 个 总 
量 折 扣 〈 例 如， 流量 在 40 ~ SOTB 时 价格 为 0.5 元 /GB，100TB 以 上 时 为 0.15 元 / 
GB), 不过， 当 内 容 提供 商 的 流量 超过 每 月 定额 时 ， 一 些 CDN 提供 商会 实行 一 个 惩 
昼 措 施 ， 其 目的 是 引导 内 容 提 供 商 更 精确 地 估计 每 月 流量 数据 ， 这 反 过 来 也 有 助 于 
CDN 进行 更 好 的 设施 容量 规划 。 不 过 ， 总 量 折扣 一 般 都 是 针对 那些 流量 非常 高 的 内 
容 提供 商 。 


8.2.2 基于 百 分 位 数 的 定价 


另 一 个 常用 的 定价 方式 是 基于 流量 的 第 95 百 分 位 数 ” 。 在 这 个 策略 中 ，CDN 对 
内 容 提供 商 的 带宽 使 用 情况 进行 周期 性 的 采样 ， 在 月 末 计 算 带宽 使 用 率 是 否 超过 
95% ， 并 在 此 基础 上 根据 带宽 使 用 情况 以 Mbit/s 为 单位 收取 费用 。 

大 多 数 CDN 提供 商都 提供 上 述 两 种 方案 ， 内 容 提供 商 可 以 选择 对 自己 合适 的 方 
案 。 在 本 章 的 后 面部 分 将 讨论 这 些 不 同 定价 方案 的 差异 。 


8.3 ”背景 和 相关 工作 


目前 ， 有 两 大 类 工作 与 CDN 的 定价 密切 相关 。 第 一 类 是 对 存在 着 拥塞 的 网 络 进 
行 定 价 研究 ; 第 二 类 是 从 经 济 性 角度 研究 内 容 分 发 ， 其 中 包括 一 些 对 CDN 定价 的 
研究 。 


8.3.1 网 络 中 的 拥塞 定价 


对 网 络 拥塞 的 定价 研究 通常 着 眼 于 定价 与 服务 质量 (QoS) 之 间 的 相互 作用 , R 
用 的 方法 是 研究 拥塞 成 本 和 网 络 容量 成 本 之 间 的 折 中 。 当 网 络 容量 不 能 简单 地 增加 且 
网 络 应 用 对 QoS 的 需求 非常 严格 时 ， 定 价 就 对 实现 期 望 的 QoS 起 到 了 关键 的 作用 。 特 
别 地 ， 价 格 的 提高 可 以 促使 用 户 降 低 他 们 的 流量 并 控制 对 网 络 服务 的 要 求 ， 这 就 反 过 


BAA, 将 一 个 班级 的 考试 成 绩 从 低 到 高 排列 ， 如 果 一 个 学 生 的 成 绩 比 95% 的 同学 高 ， 则 其 成 绩 就 
是 第 95 百 分 位 数 。 一 一 译 者 注 
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来 降低 了 网 络 的 拥塞 。Mendelson05] Mendelson 和 Whang"! 针对 存在 延 时 开销 的 计算 
机 服务 提出 了 相应 的 定价 模型 ， 其 他 的 相关 工作 包括 对 互联 网 中 存在 拥塞 的 资源 进行 
定价 nn 以 及 在 基于 QoS 方案 按 优先 级 传输 数据 包 时 的 QoS 定价 ， 如 Diffserv 和 Int- 
有 的 参考 文献 研究 了 在 流量 突 发 情况 下 的 定价 问题 。Kelly 认为 ， 流 量 突 发 时 的 
定价 可 以 基于 有 效 带 宽 '”: 。 不 过 ， 有 效 带宽 依赖 于 网 络 连接 资源 和 流量 多 路 复 用 的 
特性 ， 因 此 并 不 容易 预测 。 为 此 ，Kelly 提出 了 一 个 近似 解 ， 包 括 按 单位 时 间 、 单 位 
流量 和 单个 连接 等 几 种 方式 的 收费 ' “|。 

在 CDN 的 语 境 中 ， 定 价 的 目标 并 不 是 单纯 为 了 降低 CDN 内 的 拥塞 ， 内 容 提供 商 
不 会 因为 流量 达到 预 设 的 限制 而 去 拒绝 客户 端 发 出 的 请 求 。 例 如 ， 瞬 时 拥塞 不 能 事先 
预测 ， 并 且 内 容 提供 商 购买 CDN 服务 就 是 为 了 应 对 流量 的 峰值 问题 ， 而 这 恰恰 就 是 
CDN 的 魅力 所 在 。 由 于 其 用 户 之 间 的 流量 不 是 高 度 相关 的 ， 所 以 一 个 内 容 提 供 商 流 
量 的 激增 可 以 通过 分 配给 其 更 多 一 些 资源 而 轻松 解决 。 因此， 拥塞 的 降低 并 不 是 定价 
的 关键 目标 。 这 样 ， 即 使 拥塞 定价 的 研究 成 果 能 用 得 上 ， 也 并 非 就 顺理成章 地 应 用 到 
CDN 领域 。 


8.3.2 内 容 分 发 的 经 济 性 


CDN 的 历史 可 以 追溯 到 代理 服务 器 使 用 的 缓存 ， 当 时 ISP 零售 商用 之 实现 在 网 络 
边缘 对 内 容 进 行 存储 和 分 发 。Hosanagar EA” 从 经 济 学 角度 研究 了 网 络 缓存 技术 ， 
发 现 当 内 容 提供 商 转向 动态 内 容 发 布 并 同时 搜集 关于 网 站 使 用 习惯 的 精确 信息 时 ， 传 
统 的 “尽力 而 为 ”( best - effort) 缓存 技术 的 采用 率 将 会 降低 。Hosanagar 等 人 认为 ， 
CDN 服务 的 重要 作用 体现 在 充当 下 面 两 方 的 媒介 : 寻求 边缘 分 发 收益 的 内 容 提供 商 - 
和 有 能 力 在 网 络 边缘 处 安装 服务 器 的 ISP 零售 商 。 从 这 个 角度 看 ，CDN 允许 内 容 提 供 
商 在 避免 “尽力 而 为 ”缓存 技术 带 来 的 成 本 的 前 提 下 ， 获 得 边缘 分 发 的 收益 。 

Kaya 等 人 "对 内 容 分 发 市 场 进行 了 一 个 经 济 上 和 操作 上 的 分 析 。 针 对 CDN 的 定 
价 问题 ，Ercetin 等 人 "研究 了 一 个 区 分 服务 (differentiated service) CDN 的 最 优 定价 
和 资源 分 配方 案 ，Hosanagar 等 人 "研究 了 一 个 垄断 的 CDN 提供 商 的 最 优 定价 方 
案 。 他 们 发 现 ， 当 内 容 提 供 商 具有 相似 的 流量 突 发 水 平时 ,传统 的 基于 使 用 量 的 定价 
方案 需要 使 用 总 量 折扣 的 策略 。 不 过 ， 当 内 容 提供 商 流量 突 发 的 原因 并 不 一 样 时 ， 这 
种 折扣 被 证 明 是 次 优 的 。 进 一 步 ， 他 们 发 现 基于 百 分 位 数 的 定价 策略 的 收益 可 能 大 大 
高 于 传统 的 基于 使 用 量 的 收费 方法 。 在 下 节 中 ， 将 更 详细 地 讨论 上 述 研 究 中 的 模型 及 
其 效果 。 

除 此 之 外 ,还 存在 着 其 他 的 内 容 边 缘分 发 模型 ， 包 括 基于 PP 的 内 容 分 发 。 
Courcobetis 等 人 "1 研究 了 基于 P2P 的 内 容 分 发 的 市 场 模型 ， 将 其 作为 基于 CDN 的 内 
容 分 发 的 替代 物 。Johar EA BERET PAP 网 络 对 CDN 市 场 的 影响 。 他 们 发 现 ， 由 
于 在 P2P 网 络 中 内 容 提供 商 的 资源 被 非法 地 分 发 ，P2P 网 络 能 够 促使 内 容 提供 商 寻 求 
高 质量 的 CDN 服务 ， 将 之 作为 与 上 述 非法 行为 竞争 的 一 个 手段 ， 这 反而 可 能 会 使 
CDN 企业 有 可 能 从 中 受益 。 
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8.4 CDN 价格 模型 


本 节 提 出 的 CDN 定价 模型 ， 可 以 分 析 内 容 提 供 商 从 CDN 服务 中 获得 的 利益 ， 这 
些 模 型 基于 参考 文献 [10] ， 用 于 研究 定价 策略 。 

假设 一 个 市 场 中 有 一 个 垄断 的 CDN 提供 商 ， 这 时 内 容 提供 商 面 临 两 个 选择 : 要 
么 自行 分 发 内 容 (通过 自己 的 服务 器 或 者 托管 服务 ， 以 下 简称 为 自给 方式 ) ， 要 么 外 
包 给 一 个 CDN。 内 容 提 供 商 之 间 的 差异 在 于 它们 的 外 包 成 本 C, 和 平均 流量 水 平 ( 即 
平均 抵达 率 ) A。 平均 抵达 率 是 内 容 提 供 商 处 理 流量 大 小 的 一 个 度量 。 以 往 的 经 验 性 
研究 显示， 平均 抵达 率 等 于 和 的 内 容 提供 商 的 数量 为 &(A) =B/A"， Hide [1， 
2] RB 为 常数 。 将 内 容 分 发 进行 外 包 的 成 本 C, 包 括 为 便于 CDN 分 发 而 对 内 容 进行 修 
改 的 成 本 ， 以 及 与 第 三 方 (BD CDN 提供 商 ) 共享 秘密 数据 的 成 本 。 假 设 C, 的 累积 分 
布 函数 (cdf) 和 概率 分 布 函数 (pdf) 分 别 由 式 H(C,) = C7 MZ AC C,) = PC 给 
出 ， 其 中 丈 是 一 个 正 的 常数 ，C。e [0，1]。 调 整 参数 不可 以 调节 外 包 成 本 低 的 那 
些 内 容 提 供 商 的 相对 比例 。 当 下 =1 时 ，C,。 服 从 均匀 分 布 ; 24 Wo 1 时 分 布 向 负 方 向 
Mis, 4W< 时 分 布 向 正方 向 倾斜 。 实 际 中 ，C, 的 上 界 可 以 是 任意 值 ， 但 不 失 一 般 
性 本 节 将 其 规格 化 为 1。 一 般 而 言 ， 因 为 CDN 可 以 直接 观测 到 全 部 的 流量 信息 ， 所 以 
CDN 知道 所 有 内 容 提供 商 的 入， 但 是 CDN 并 不 清楚 内 容 提供 商 的 外 包 成 本 C,。 这 里 ， 
假设 所 有 内 容 提 供 商 外 包 成 本 的 分 布 H(C,) 已 知 。 

为 了 确定 CDN 的 最 优 定价 机 制 ， 本 节 按 照 如 下 方式 进行 分 析 : 首先 ， 确定 一 个 
内 容 提供 商 在 自给 和 通过 CDN 分 发 内 容 两 种 情况 下 的 期 望 收益 。 在 确定 这 两 种 情况 
下 的 预期 收益 后 ， 内 容 提供 商 从 中 选择 收益 较 高 的 那 种 。 购 买 CDN 服务 的 决策 是 一 
个 定价 策略 的 函数 。 根 据 内 容 提供 商 的 购买 决策 函数 ， 可 以 确定 使 CDN 预期 收益 最 
大 的 最 优 定价 策略 。 下 面 分 析 内 容 提供 商 在 自给 和 借助 CDN 分 发 内 容 这 两 种 情况 下 
的 期 望 收益 。 


8.4.1 内 容 提 供 商 采用 自给 方式 


对 于 一 个 内 容 提供 商 〈 记 为 CP)， 为 用 户 提供 内 容 分 发 的 平均 流量 为 和 A。 随机 变 
量 式 表示 给 定时 段 内 内 容 提供 商 收 到 的 实际 请 求 数 。 在 任意 时 段 , 式 的 分 布 事先 已 知 
而 其 实际 值 未 知 。 内 容 提供 商 在 分 发 内 容 时 ， 可 以 直接 对 基础 设施 进行 投资 ， 使 之 具 
备 单位 时 间 内 平均 处 理 了 个 请 求 的 能 力 。 这 时 ， 其 内 容 分 发 的 收益 为 
U,4(X) = V(X) - C(I) - c» L(],X) (8.1) 
式 中 ， 函 数 V 是 内 容 提 供 商 响应 所 有 XX 个 请 求 的 收益 ; 函数 C 是 设施 的 维护 成 本 
(如 服务 器 、 带 宽 、 软 件 等 ) ， 由 于 规模 经 济 效益 的 原因 函数 C 对 7 了 而 言 是 一 个 止 函 
数 ” ;函数 工 是 被 拒绝 的 请 求 数 ， 它 随 着 忒 的 增加 而 增加 ， 随 着 了 增加 而 减 小 ; c 是 
拒绝 一 个 请 求 的 成 本 。 


O 经 济 学 中 的 四 函数 与 高 等 数学 中 的 定义 恰恰 相反 。 一 译 者 注 。 
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函数 了 中 涵盖 了 内 容 提 供 商 在 互联 网 运营 〈 如 在 网 上 出 售 产品 等 ) 中 的 所 有 收 

和 来源 。 内 容 提 供 商 的 相关 设施 成 本 可 以 建 模 为 
C(I) 2a,*I-a,*P, X] VI <a,/2a, 

该 式 表 明了 和 成 本 之 间 的 函数 是 止 性 的 。 约 束 条 件 I <a,/20, 确保 了 网 络 设施 的 
成 本 对 于 7 而 言 总 是 单调 上 升 的 (注意 对 于 7> ai/2a A C'(I) <0)。 在 该 式 中 ，a, 取 
值 大 时 表明 网 络 设施 成 本 高 ， 而 a, 取 值 大 则 说 明 规模 经 济 效 益 明显 。 

由 式 (8. 1) ， 内 容 提 供 商 分 发 内 容 得 到 的 期 望 收 益 为 

U,, = E[U,(X)] 2 V-C(I) -c° L(I) (8.2) 
WP, LU) = ELLO, X) ] RV = ELV(X)] 。 内 容 提供 商 选 择 一 个 合适 的 设施 建设 水 
平 以 最 大 化 其 期 望 收益 。 内 容 提供 商 的 决策 问题 可 以 表示 为 
max | U (1 


用 二 表示 网 络 设施 建设 的 最 优 水 平 ， 相 应 的 期 望 收益 表示 为 Us(1" ) 。 
8.4.2 内 容 提供 商 通过 CDN 进行 分 发 


对 于 内 容 提 供 商 而 言 ， 另 一 种 选择 就 是 通过 CDN 来 分 发 内 容 。 这 种 情况 下 ， 内 
容 提供 商 的 收益 为 
Ucon(X) = V(X) +r(N) X - C, - P(X) (8.3) 
AF, RAV AX Ae OAC ATR; 函数 7 指 通过 数量 为 N 的 一 组 CDN 服务 器 实 
现 更 快 的 内 容 分 发 时 由 每 个 请 求 得 到 的 收益 ; C, 为 内 容 分 发 的 外 包 成 本 ; 函数 已 是 内 
容 提 供 商 支付 的 CDN 使 用 费 。 
内 容 提供 商 付出 的 外 包 成 本 包括 内 容 修 改 成 本 或 与 CDN 共享 秘密 内 容 的 成 本 。 
前 者 与 修改 内 容 的 成 本 相关 ， 目 的 是 加 速 CDN 的 内 容 分 发 。 之 所 以 存在 共享 秘密 内 
容 的 成 本 ， 是 因为 内 容 提 供 商 可 能 需要 与 CDN 共享 一 些 敏 感 信 息 ， 如 消费 者 的 相关 
记录 、 信 用 卡 资料 或 病人 的 病历 等 。 这 种 成 本 可 能 是 某 种 形式 的 风险 ， 也 可 能 来 自 为 
确保 安全 而 需要 采取 的 额外 步 又。 共享 秘密 数据 的 成 本 一 般 因 内 容 提供 商 而 异 ， 因 为 
不 同 内 容 提 供 商 处 理 的 数据 类 型 存在 着 内 在 的 差异 。 
内 容 提供 商 并 不 清楚 任 一 时 段 内 有 多 少 请 求 (X) 出 现 , 但 是 对 于 给 定 的 任意 价 
格 函数 P(X)， 可 以 使 用 式 (8.4) 计算 在 使 用 CDN 服务 时 的 期 望 收 益 : 
Uoan = El Ucpy(X)] = Ve v(N)A - C, - E[P(X)] (8.4) 
如 果 满 足 条 件 Uon m UI) ， 则 内 容 提供 商 选择 购买 CDN 服务 。 将 式 〈8. 2) 
和 式 (8.4) 代入 这 个 条 件 可 得 , 平均 流量 为 A* 和 外 包 成 本 为 C, 的 内 容 提供 商 选 择 使 
用 CDN 服务 的 条 件 为 
C,<r(N)A+C(I") *c* L(I*) -ELP(X)] (8.5) 


8.4.3 CDN 的 收益 函数 


内 容 提供 商 选择 自给 的 方式 还 是 选择 通过 CDN 的 方式 来 分 发 内 容 ， 取 决 于 哪 种 
方式 能 够 带 来 最 大 的 期 望 收益 。 前 面 提 过 ，CDN 并 不 清楚 任何 一 个 内 容 提供 商 的 外 
包 成 本 。 因 此 ， 对 于 一 个 给 定 的 P(X) 值 ， 它 并 不 能 确定 一 个 特定 的 内 容 提供 商 是 否 
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会 购买 CDN 服务 。 不 过 ，CDN 知道 C, 在 所 有 内 容 提 供 商 上 的 分 布 ， 因 此 它 可 以 计算 
内 容 提供 商 购买 CDN 服务 的 概率 。 由 H( C,) = C。， 一 个 平均 流量 为 的 内 容 提供 商 
购买 CDN 服务 的 概率 为 
Pr( 购买 | A) = (7(N)A+C( 广 ) +c L(I) - EL P(X) ])" (8.6) 
如 果 g( 和 A) 表示 平均 流量 为 A 的 内 容 提供 商 的 数量 ， 那 么 购买 CDN 服务 的 内 容 
提供 商 的 期 望 数量 为 
Subs(A) = g(A)(TCN)A + C(I") +c- LT) - E[P(X)])" (8.7) 
对 于 请 求 X 的 一 个 实际 值 ， 任 何 一 个 购买 CDN 服务 的 内 容 提 供 商 支付 的 费用 为 
P(X) 。 既 然 了 不 能 预知 ， 故 CDN 并 不 能 通过 一 个 价格 函数 P(X) 事先 获悉 自己 的 收 
益 。 然 而 ，CDN 的 期 望 收益 可 以 通过 式 (8.8) 计算 。 


rs {[Subs(a) ( [praxi A) - P(X)dx)da} 


- fb (Ja- Subs(A) da) - bala Subs(A) da) } (8. 8) 


在 上 面 的 表达 式 中 ， 第 一 项 代表 了 CON 的 期 望 收益 ， 其 中 , P(X la) 表示 平均 流量 
为 A 的 内 容 提供 商 收 到 XX 个 请 求 的 概率 。 因 此 ，[Pr(X | A)» P(X)dxX 代 表 了 从 一 个 平 


均 流 量 为 A 的 内 容 提 供 商 处 获得 的 期 望 收益 。 利 用 式 (8.8) 对 所 有 的 内 容 提供 商 求 
和 ， 可 得 CDN 的 总 期 望 收益 。 第 二 项 代表 了 CDN 的 成 本 ， 建 模 为 CDN 处 理 的 平均 流 


量 的 二 次 函数 (由 [A «Subs A) dA 给 出 ) 。 这 项 成 本 包括 与 内 容 分 发 相关 的 成 本 ， 以 


及 保持 副本 间 内 容 一 致 性 的 成 本 。 保 持 一 致 性 的 工作 是 一 种 记 账 机 制 ， 实 现 对 与 请 求 
的 路 由 和 分 发 相关 的 信息 进行 收集 和 跟踪 '”。 所 有 这 些 行为 都 具有 规模 效益 ， 因 此 
成 本 相对 于 流量 应 该 是 目的 ， 而 这 种 四 性 用 二 次 函数 来 表示 。 注 意 ,计算 内 容 提 供 商 
和 CDN 提供 商 的 成 本 时 两 者 的 参数 是 不 同 的 〈 即 a, b, a,#b,)), REAA CDN 
的 成 本 还 包括 其 他 因素 ， 如 记 账 成 本 、 内 容 一 致 性 的 维护 成 本 以 及 内 容 分 发 成 本 。 
CDN 的 决策 问题 就 是 选择 一 个 价格 函数 P(X) ， 以 实现 其 期 望 收益 的 最 大 化 。 


8.4.4 泊 松 分 布 和 突 发 流量 时 的 最 优 定价 


本 节 通 过 仿真 来 确定 CDN 的 最 优 定价 策略 。 考 虑 一 个 由 1 000 个 内 容 提供 商 构成 
的 总 体 ， 内 容 提供 商 的 平均 抵达 率 服从 区 间 [1000, 8000] 上 的 帕 累 托 分 布 。 对 于 
给 定 的 平均 抵达 率 ， 流 量 可 以 通过 如 下 分 布 生成 。 

1. 泊 松 分 布 

所 有 1000 个 内 容 提 供 商 的 流量 服从 泊 松 分 布 。 

2. 突 发 流量 

假设 所 有 的 内 容 提供 商都 有 突 发 流量 ,并 使 用 马尔 科 夫 调制 泊 松 过 程 ( MMPP) 
对 突 发 流量 进行 建 模 。MMPP 一 般 用 于 对 Web 服务 器 上 的 突 发 流量 进行 建 模 '"")， 
它 是 一 个 双 随 机 泊 松 过 程 ， 其 中 抵达 率 由 一 个 m 状态 的 马尔 科 夫 过 程 给 出 。 当 马尔 
科 夫 链 处 于 状态 j 时， 请 求 的 抵达 服从 抵达 率 为 A, 的 泊 松 过 程 。 考 虑 一 个 简单 的 2 状 
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AS MMPP， 其 抵达 率 分 别 为 A 和 A,， 相 过 程 的 极限 状态 概率 为 g = (g,，g,)。 单 位 
时 段 内 请 求 数 的 均值 和 方差 分 别 记 为 A 和 到 。 对 一 个 流量 突 发 进行 建 模 时 ， 假 定 以 非 
零 概率 转移 到 状态 2， 且 A, 具 有 一 个 很 大 的 值 。 设 A, = 10A, E MMPP 的 参数 为 
(q, 20.9, q, =0.1) ， 也 就 是 说 ， 在 流量 突 发 期 间 平 均 抵达 率 是 正常 情况 下 的 10 倍 ， 
同时 系统 负载 平均 而 言 上 升 了 10% 左右 。 通 过 改变 A, 的 值 可 以 模拟 不 同 的 均值 A。 
另外 ， 当 平均 抵达 率 A 增加 时 ,调整 状态 转移 概率 以 维持 恒定 的 突 发 状况 (恒定 值 
ASW) 。 

3. 混合 流量 

500 个 内 容 提 供 商 的 流量 服从 泊 松 分 布 ， 另 外 500 个 服从 MMPP 分 布 。 

仿真 中 的 其 他 参数 设置 为 : 对 于 网 络 设施 成 本 函数 C(1) = a,* 1 - a,* 了 ,假设 
a, =3. 56 Fila, =0. 000 043， 这 些 参数 与 现实 中 的 网 络 设施 成 本 大 致 相当 。 例 如 ， 在 
这 种 参数 值 设 定 下 ， 每 分 钟 响应 233 个 请 求 的 成 本 是 每 月 804 元 。 如 果 假 设 对 请 求 的 
响应 内 容 的 平均 大 小 为 100KB， 那 么 就 意味 着 响应 数据 在 3. 10Mbit/s 的 情况 下 成 本 为 
每 月 804 元 ， 这 对 于 部 分 T3 连接 及 维护 低 端 服务 器 的 成 本 来 说 是 合理 的 。 同 样 ， 每 
分 钟 响 应 6 975 个 请 求 的 成 本 为 22 042 元 ， 这 大 致 上 也 就 是 T3 连接 的 成 本 和 相对 应 
的 维护 服务 器 的 成 本 ， 这 些 成 本 也 与 作者 撰写 本 节 时 主机 托管 的 成 本 大 致 相当 。 丢 弃 
一 个 请 求 的 成 本 c 这 里 假设 为 10 元 ， 其 依据 是 : 假定 10% 的 网 站 访问 者 购买 产品 / 服 
务 ， 每 次 购买 的 平均 交易 额 为 100 元 ， 而 如 果 顾 客 的 请 求 没有 得 到 响应 ， 则 顾客 就 会 
离开 网 站 。 最 后 ， 假 设 内 容 提 供 商 的 外 包 成 本 服从 区 间 [0, 30000] 上 的 均匀 分 布 。 

基于 上 述 设置 ， 计 算 每 一 个 内 容 提 供 商 在 自给 情况 下 的 最 优 网 络 设施 配置 和 相关 
的 期 望 收 益 。 接 着 ， 计 算 在 给 定 的 CDN 价格 函数 下 ， 内 容 提供 商 采 用 CDN 分 发 服务 
时 的 期 望 收益 。 对 于 CDN 价格 函数 ， 这 里 仅 采 用 二 次 函数 ， 即 P(X) = p。 Xp 
X. , 并 使 用 网 格 搜索 的 方法 得 到 p, 和 p 的 最 优 值 。 注 意 ， 上 述 价格 函数 对 凸 性 和 凹 性 
的 价格 模式 都 可 以 实现 建 模 。 对 于 每 一 个 内 容 提 供 商 ， 根 据 相 应 的 请 求 抵达 分 布 
( 泊 松 或 者 MMPP) H X ÆR 1000 个 样本 值 。 给 定 pp 和 p,， 可 以 计算 对 应 于 每 一 个 
值 的 价格 PCX) , E X AY 1000 个 值 取 平 均 可 以 得 到 内 容 提供 商 的 期 望 价 格 。 给 定 这 
些 参数 ， 就 可 以 计算 出 采用 CDN 分 发 服务 时 的 期 望 收益 。 如 果 该 收益 大 于 自给 情况 
下 的 收益 ， 则 内 容 提供 商 选择 购买 CDN 服务 。 对 内 容 提供 商 购 买 CDN 服务 所 带 来 的 
期 望 收益 求 和 ， 并 减 去 CDN 的 成 本 (使 用 式 (8.8) HR, HF b =3, b= 
0.000047) 就 可 以 得 到 CDN 的 期 望 收益 。 通 过 50 次 仿真 计算 出 最 优 价格 ， 下 面 给 出 
主要 仿真 结果 。 

1. 当 流 量 服从 泊 松 分 布 时 最 优 定价 需要 使 用 总 量 折扣 

当 内 容 提供 商 的 流量 服从 泊 松 分 布 时 ，CDN 的 最 优 价格 函数 P" (XO) 为 3.9X - 
0. 000066Y。 也 就 是 说 ， 在 流量 服从 泊 松 分 布 时 最 优 定 价 需 要 使 用 总 量 折扣 。 即 使 改 
变 仿真 的 参数 ， 最 优 价格 仍 保持 止 性 ， 而 且 折 扣 的 大 小 随 内 容 提 供 商 设施 成 本 中 规模 
效益 的 增加 (a, AOS) 而 增加 。 

2. 流量 突 发 时 最 优 价 格 较 高 

图 8.1 给 出 了 流量 在 三 种 不 同 分 布下 的 最 优 价格 。 可 以 看 出 ，CDN 在 流量 突 发 
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现象 增多 的 情况 下 可 以 设 定 更 高 的 价格 ， 特 别 地 ， 有 Price (MMPP) > Price (E 
合 ) > Price QAH) 。 这 是 因为 ， 存 在 突 发 流量 时 CDN“ 避 免 请 求 丢失 ”这 一 针对 
内 容 提 供 商 的 价值 主张 得 到 了 强化 。 因 此 ，CDN 的 收费 价格 会 有 较 大 提升 。 有 意思 
的 是 ， 在 混合 情况 下 最 优 价 格 是 凸 性 的 ， 并 存在 量 大 多 收费 而 不 是 量 大 优惠 的 情况 ， 
原因 将 在 下 面 给 出 。 
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请 求 数量 X 
图 8.1 三 种 流量 类 型 的 最 优 价格 函数 


3. 在 流量 突 发 时 传统 的 基于 使 用 量 的 定价 方式 效率 低下 

考虑 图 8. 2 所 示 的 总 量 折扣 定价 机 制 。 内 容 提 供 商 CP, 的 平均 抵达 率 为 和 ， 不 失 
一 般 性 ， 假 设 CP, 有 确定 性 的 请 求 抵达 过 程 。 每 个 时 段 中 ，CP, 收 到 和 个 请 求 (图 8.2 
中 的 4 点 ) 并 向 CDN 支付 期 望 价格 已 。CP, 具 有 相同 的 均值 A 而 方差 较 大 。CP, 以 某 
些 大 概率 收 到 请 求 (如 图 8.2 中 B 点 所 示 ) ， 但 在 余下 的 时 间 内 ， 它 收 到 大 量 请 求 
(如 图 8.2 中 C 点 所 示 ) 。CP, 支 付 的 期 望 价格 为 已 ， 从 图 8. 2 中 可 以 看 出 P, 明 显 低 于 
P 。 这 一 现象 是 由 四 函数 本 身 的 特性 造成 的 ， 与 实际 情况 不 符 。 方 差 较 大 的 内 容 提 供 
商 反而 从 CDN 获得 更 大 的 收益 ， 这 显然 不 是 希望 的 结果 ， 在 理想 情况 下 CDN 应 该 向 
CP, 收 取 更 高 的 价格 。 因 此 ， 即 使 自给 方式 下 设施 成 本 本 身 具 有 的 四 性 使 价格 函数 趋 
TUE, CON 也 应 该 选择 凸 函数 作为 定价 函数 。 需 要 注意 的 是 ， 只 有 当 流量 突 发 时 
各 个 内 容 提 供 商 的 参数 存在 差异 时 这 种 凸 性 才 会 出 现 ， 如 果 所 有 内 容 提 供 商 在 具有 相 
同 的 平均 抵达 率 的 同时 方差 也 相同 ， 那 么 这 种 凸 性 就 不 会 发 生 。 

如 果 CDN 使 用 一 个 凸 的 价格 函数 ， 那 么 平均 抵达 率 高 的 内 容 提 供 商 将 会 受罚 。 
对 于 抵达 率 分 别 固定 为 2A ALA 的 两 个 内 容 提 供 商 ， 前 者 需要 为 使 用 CDN 服务 支付 更 
高 的 额外 费用 。 相 比 而 言 ， 抵 达 率 为 2A 的 内 容 提供 商 在 自给 方式 下 能 得 到 总 量 折扣 ， 
因此 更 倾向 于 用 自给 的 方式 来 分 发 内 容 。 因 此 ， 一 个 凸 的 价格 函数 会 阻碍 那些 流量 高 
和 流量 变化 不 大 的 内 容 提 供 商 购买 CDN 服务 。 因 此 ， 在 混合 模式 下 最 优 价格 函数 的 
形状 取决 于 流量 突 发 在 内 容 提 供 商 之 间 的 分 布 ， 也 取决 于 内 容 提 供 商 自身 设施 成 本 的 
总 量 折 扣 的 大 小 。 

以 上 分 析 间 接地 显示 出 在 混合 模式 下 传统 的 基于 使 用 量 的 价格 策略 的 低 效 性 。 该 
定价 策略 或 者 会 惩罚 低 突 发 的 内 容 提供 商 或 者 会 惩罚 高 流量 的 内 容 提供 商 ， 这 取决 于 
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使 用 凸 价格 函数 还 是 上 四 价格 函数 。 因 此 ， 需 要 考虑 另外 一 种 基于 某 个 使 用 量 百 分 位 数 
的 定价 策略 。 





任何 时 段 内 的 请 求 数 X 
图 8.2 四 价 格 函数 的 期 望 价格 


4. 基于 百 分 位 数 的 定价 机 制 对 于 CDN 而 言 更 加 有 利 可 图 

现在 讨论 基于 使 用 量 百 分 位 数 的 定价 机 制 。 例 如 ，CDN 监控 某 个 时 段 内 (如 1 
个 月 ) 的 请 求 率 ， 并 计算 该 时 段 内 每 个 内 容 提供 商 的 请 求 率 的 第 95 百 分 位 数 ， 对 该 
内 容 提 供 商 的 定价 就 基于 其 带宽 使 用 率 的 第 95 百 分 位 数 。 令 Z 为 请 求 率 下 的 第 95 A 
分 位 数 ， 与 之 前 一 样 ， 为 简化 计算 这 里 仅 关 注 二 次 价格 函数 ,， 设 P(Z) =p,-Z+p,° 
Z ， 并 定量 地 计算 基于 百 分 位 数 的 最 优 价 格 。 图 8. 3 中 显示 的 是 CDN 在 基于 百 分 位 
数 的 定价 机 制 和 传统 的 基于 使 用 量 的 定价 机 制 下 的 期 望 收益 。 当 各 内 容 提供 商 的 流量 
分 布 特性 各 异 时 ，CDN 使 用 基于 百 分 位 数 定价 策略 的 收益 要 比 传统 的 基于 使 用 量 的 
定价 策略 高 。 同 时 ， 流 量 服从 单纯 的 泊 松 分 布 和 MMPP 时 ， 基 于 百 分 位 数 的 定价 策 
略 与 传统 的 基于 使 用 量 的 定价 策略 之 间 在 收益 上 没有 明显 差别 。 这 个 现象 并 不 奇怪 ， 
因为 在 这 两 种 情况 下 一 旦 平均 请 求 率 固定 下 来 ， 那 么 方差 也 随 之 固定 2 ， 从 而 一 个 基 
于 均值 的 定价 策略 可 以 转化 为 基于 百 分 位 数 的 定价 策略 ， 反 之 亦 然 。 在 混合 情况 下 ， 
基于 百 分 位 数 的 定价 机 制 允许 CDN 向 内 容 提供 商 提 供 总 量 折扣 ， 并 同时 向 那些 具有 
高 突 发 流量 的 内 容 提供 商 设 定 更 高 的 价格 。 

基于 百 分 位 数 的 收费 策略 也 有 不 足 之 处 : 相对 于 传统 方式 而 言 收 费 机 制 更 复杂 ， 
目 缺 乏 标准 化 (例如 ,采样 次 数 的 选择 会 对 收费 产生 影响 ) 。 这 些 问题 已 经 使 业内 开 
始 关注 到 底 什么 样 的 收费 策略 才 是 最 合适 的 。 由 于 这 个 原因 ， 有 些 CDN (如 SyncCa- 
st) 采用 了 传统 的 基于 使 用 量 的 收费 方式 ， 因 为 该 方法 的 确 简单 。 然 而 ， 本 章 的 分 析 
结果 表明 ， 当 不 同 的 内 容 提供 商 具 有 不 同 的 流量 突 发 特性 时 (现实 中 往往 如 此 )， 基 
于 百 分 位 数 的 定价 策略 要 比 传统 的 基于 使 用 量 的 定价 策略 更 加 有 利 可 图 。 当 各 内 容 提 
供 商 的 流量 突 发 特性 相似 时 ，CDN 可 以 选择 传统 的 基于 使 用 量 的 定价 机 制 来 简化 收 
费 方式 。 


O “对 于 泊 松 分 布 ， 方 差 等 于 均值 。 对 于 MMPP 过 程 ， 方 差 等 于 流量 突 发 (常量 与 均值 的 乘积 的 二 
次 方 。 一 一 原 书 注 . 
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CDN 收 益 (107) 





泊 松 MMPP 混合 
流量 分 布 


图 8.3 不 同 的 定价 策略 和 流量 分 布下 CDN 的 收益 


8.5 与 给 使 用 者 


CDN 面临 着 一 个 复杂 的 定价 问题 。 一 方面 ， 与 传统 的 基于 使 用 量 的 定价 策略 相 
比 ， 基 于 百 分 位 数 的 定价 策略 能 产生 明显 的 效益 ， 而 前 者 不 能 很 好 地 监控 流量 的 突 发 
或 峰值 ; 另 一 方面 ， 基 于 百 分 位 数 的 定价 策略 给 人 的 印象 是 针对 流量 峰值 收费 ， 因 而 
受到 了 来 自 某 些 内 容 提 供 商 和 业界 专家 的 反对 。 

尽管 百 分 位 数 定价 策略 具有 高 收益 性 ， 这 里 仍然 期 望 ， 内 容 提供 商 面 对 定 价 机 制 
透明 性 的 要 求 以 及 竞争 压力 的 存在 ， 可 以 最 终 促使 百 分 位 数 定价 策略 的 使 用 在 未 来 几 
年 有 所 下 降 。 如 果 当 前 那些 主导 的 CDN 提供 商 将 百 分 位 数 定价 策略 作为 其 首选 ， 那 
么 新 进入 该 领域 的 CDN 提供 商 就 应 该 与 之 相 区 别 ， 转 而 提供 更 加 透明 的 定价 方案 . 
如 果 那 些 更 透明 的 CDN 定价 方式 被 内 容 提供 商 采 用 ， 这 将 反 过 来 迫使 那些 主导 提供 
商 也 使 用 更 加 透明 的 定价 方式 。 

另外 一 个 可 能 性 是 更 多 的 CDN 将 同时 提供 传统 的 基于 使 用 量 的 定价 策略 和 基于 
百 分 位 数 的 定价 策略 ， 由 内 容 提供 商 根据 自身 的 偏好 自行 选择 。 事 实 上 ， 若 干 CDN 
服务 商 已 经 开始 提供 这 两 种 定价 方式 ， 并 允许 内 容 提 供 商 自己 选择 。 不 过 ， 这 种 情况 
对 于 CDN 而 言 是 否 真 的 有 好 处 尚 不 明朗 。 具 有 高 突 发 流量 的 内 容 提 供 商 愿意 选择 传 
统 定价 机 制 来 避免 因 流量 突 发 而 带 来 的 处 罚 ; 而 那些 具有 低 突 发 流量 的 内 容 提 供 商 愿 
意 选 择 百 分 位 数 计价 方式 ， 因 为 这 种 方案 能 够 对 具有 高 突 发 流量 的 内 容 提 供 商 多 收费 
而 对 具有 低 突 发 流量 的 内 容 提 供 商 提供 奖励 。 因 此 ， 同 时 提供 这 两 种 定价 机 制 有 可 能 
会 产生 相反 的 结果 : 内 容 提供 商会 恰好 选择 CDN 不 希望 它们 选择 的 那 种 机 制 。 因 此 ， 
CDN 提供 商 最 好 能 确定 这 样 一 种 定价 策略 : 既 让 内 容 提 供 商 可 以 接受 ， 又 使 自己 能 
够 有 效 地 获得 利润 。 

总 之 ，CDN 提供 商 需 要 研究 长 远 的 解决 方案 。 这 些 解决 方案 既 包 括 培育 内 容 提 
供 商 对 百 分 位 数 定价 方式 的 兴趣 ， 也 包括 从 行业 内 彻底 取消 百 分 位 数 定价 方式 。 在 这 
一 点 上 ， 业 界 需要 采取 更 加 积极 的 态度 。 
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8.6 ”未 来 研究 方向 


本 章 强调 了 传统 的 基于 使 用 量 的 定价 模式 和 基于 百 分 位 数 的 定价 模式 之 间 不 存在 
一 个 简单 的 折 中 选择 。 一 方面 ， 基 于 百 分 位 数 的 定价 允许 CDN 在 向 一 个 流量 大 CUR 
量变 化 不 大 ) 的 内 容 提 供 商 提供 总 量 折扣 的 同时 ， 对 有 着 高 突 发 流量 的 内 容 提供 商 
提高 收费 。 男 一 方面 ， 基 于 百 分 位 数 的 定价 方式 可 能 很 复杂 ， 从 而 可 能 会 阻碍 内 容 提 
供 商 购买 CDN 服务 。 因 此 ， 许 多 CDN 提供 商 提供 了 这 两 种 定价 策略 以 便 允许 内 容 提 
供 商 自己 选择 。 未 来 一 个 有 吸引 力 的 研究 领域 是 这 两 种 定价 方法 之 间 的 交互 ， 以 及 在 
同时 提供 这 两 种 定价 策略 时 如 何 确定 最 优 的 定价 方式 。 

除 此 之 外 ， 很 多 对 CDN 定价 的 研究 工作 都 集中 在 垄断 这 个 假设 条 件 下 。 未 来 一 
个 令 人 感 兴趣 的 研究 方向 是 竞争 对 CDN 定价 策略 的 影响 。 虽 然 Akamai 已 经 在 这 个 产 
业内 占据 了 统治 地 位 ， 但 近年 来 其 竞争 对 手 也 取得 了 很 大 的 发 展 ， 如 Limelight Net- 
works 和 Level 3。 各 公司 之 间 的 竞争 似乎 已 对 占 统治 地 位 的 公司 的 定价 策略 都 产生 了 
很 大 的 影响 ”， 因 此 研究 竞争 对 CDN 定价 的 影响 将 有 助 于 推动 这 个 行业 的 发 展 。 

男 一 个 趋势 是 P2P 内 容 分 发 方式 将 成 为 CDN 的 一 种 替代 物 ， 同 时 也 出 现 了 很 多 
CDN 和 P2P 的 混合 体 。P2P 和 这 些 混合 方案 对 CDN 的 影响 现在 还 不 清楚 。 最 近 Johar 
等 人 ”研究 了 P2P 媒体 分 发 对 一 个 纯 CDN 分 发 的 收益 的 影响 ， 并 提出 了 很 多 令 人 感 
兴趣 的 结论 。 例 如 ， 他 们 发 现 ， 一 个 采用 PP 分 发 方式 的 竞争 者 有 时 对 CDN 存在 着 
积极 的 影响 。 但 是 ，P2P 和 CDN 内 容 分 发 之 间 的 相互 关系 仍 需要 进一步 研究 。 


8.7 结论 


内 容 分 发 网 络 的 定价 是 一 个 复杂 的 问题 。 购 买 CDN 服务 的 内 容 提供 商 在 流量 模 
式 及 其 处 理 内 容 类 型 上 存在 着 很 大 的 差异 ， 因 而 它们 可 能 是 高 度 异 构 的 。 同 时 ，CDN 
不 得 不 使 用 单一 的 定价 策略 应 对 所 有 这 些 不 同 的 流量 类 型 。 这 也 一 直 是 该 行业 内 存在 
很 多 争论 的 原因 。 

一 些 人 对 业内 同时 使 用 总 量 折扣 和 超额 受罚 的 现象 提出 了 质疑 。 本 章 强调 的 是 内 
容 分 发 中 的 规模 经 济 效益 推动 了 CDN 定价 中 的 总 量 折扣 方式 。 但 是 ， 突 发 流量 的 存 
在 又 给 超额 受罚 方式 找到 了 存在 的 理由 ， 一 个 解决 办 法 是 使 用 基于 百 分 位 数 的 收费 。 
这 种 定价 方式 允许 一 个 CDN 向 高 流量 的 内 容 提 供 商 提供 总 量 折扣 ， 同 时 向 出 现 很 高 
突 发 流量 的 内 容 提供 商 收 取 额 外 的 费用 。 不 过 ， 业 内 的 分 析 人 士 也 对 基于 百 分 位 数 的 
定价 方式 提出 了 质疑 ， 认 为 它 类 似 于 某 种 形式 的 峰值 定价 ， 但 这 种 定价 方式 事实 上 的 
确 有 助 于 CDN 获得 更 高 的 收益 。 

不 过 ,还 有 很 多 问题 尚未 达成 共识 ， 如 合适 的 CDN 定价 模型 、 竞 争 对 定价 和 
CDN 市 场 效益 的 影响 。 对 CDN 的 研究 者 和 从 业者 来 说 ， 这 将 仍旧 是 一 个 相当 吸引 人 
的 领域 。 
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本 章 中 的 一 些 资料 来 自 HICSS 047! pL Wharton School Working Paper" , 
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CDN 的 资源 主要 包括 网 络 设施 、 在 网 络 上 分 发 的 内 容 和 分 布 在 整个 网 络 中 包含 若 
干 资源 的 缓存 服务 器 。 为 了 获得 具有 成 本 效益 的 内 容 分 发 策略 ，CDN 的 资源 需要 有 效 
地 管理 和 分 配 。 在 提供 CDN 服务 时 ， 由 于 消费 者 的 偏好 开始 成 为 必须 考虑 的 一 个 关键 因 
K, CDON 提供 商 在 设计 其 内 容 分 发 机 制 时 也 应 该 有 一 些 服务 质量 (QoS) 方面 的 考虑 。 

在 CDN 资源 管理 和 分 配 问 题 上 ， 数 学 建 模 是 一 个 强大 和 有 效 的 工具 。 本 章 的 目 
的 ， 是 证 明 该 领域 中 的 大 量 问题 都 可 以 使 用 数学 模型 来 精确 地 阐述 ， 以 及 如 何 使 用 现 
有 技术 构造 这 些 模型 。 为 此 ， 在 9. 2 节 将 回顾 一 些 近期 的 相关 文献 及 相关 工作 ， 并 提 
出 相应 的 数学 模型 ; 在 9. 3 节 中 介绍 对 这 些 模型 的 求解 方法 ; 在 9.4 节 中 提出 一 些 适 
用 于 许多 CDN 结构 的 新 模型 ; 9. 5 节 分 析 这 些 模型 的 效果 ; 在 9.6 节 中 给 出 对 相关 使 
用 者 的 建议 ; 未 来 的 研究 方向 和 结论 分 别 在 9.7 节 和 9. 8 节 中 给 出 。 


9.2 ”相关 工作 


本 节 介 绍 与 CDN 资源 管理 和 分 配 相关 的 数学 模型 ， 并 对 有 关 文 献 进行 回顾 。 首 
先 ， 定义 一 些 本 章 将 会 用 到 的 术语 。 内 容 (content) 是 指 WWW 中 任何 公开 的 可 用 信 
息 ， 如 网 页 、 多 媒体 文件 或 文本 文档 等 。 内 容 中 一 个 特定 的 项 称 为 对 象 (object) ， 如 
一 个 声音 文件 或 一 个 文本 文档 。 内 容 提供 商 发 布 供 其 他 人 访问 的 内 容 ， 而 一 个 CDN 
提供 商 代替 前 者 分 发 内 容 。 这 可 能 会 存在 一 些 例外 ， 因 为 有 的 内 容 提供 商 自己 完成 内 
容 的 分 发 ， 因 此 本 章 假设 内 容 提供 商 将 这 个 任务 外 包 给 CDN 提供 商 。 客 户 端 (cli- 
ent) 是 指 为 获取 内 容 而 发 出 请 求 的 人 或 公司 。CDN 提供 商 将 全 部 或 部 分 内 容 保存 在 
缓存 服务 器 (caching server) ， 缓 存 服务 器 部 署 在 远程 通信 网 络 中 ， 处 理 或 转发 客户 
端的 请 求 。 在 随后 的 所 有 模型 中 ， 假 设 给 定 的 是 一 个 完全 网 络 C = (V, E), REV 
是 节点 的 集合 , E = ( |i, 放 | :i,j e V) 是 网 络 连接 的 集合 。 节 点 集 了 进一步 分 成 三 个 非 
空子 集合 人 、J 和 $， 其 中 7 是 客户 端 集合 ，J 是 安装 (或 可 以 安装 ) 缓存 服务 器 的 
节点 集合 ，5 是 源 服务 器 的 集合 ( 当 源 服务 器 只 有 一 个 时 S= 101)。 本 章 提 到 的 所 
有 模型 中 所 使 用 的 符号 参见 表 9. 1。 


四” 本文 使 用 缓存 服务 器 这 一 术语 ， 而 非 代理 服务 器 (proxy server) ， 以 避免 混淆 ， 因为 代理 服务 器 的 
概念 原 用 于 执行 过 滤 和 请 求 传递 等 ， 但 随 着 网 页 变 得 快速 和 动态 ， 这 个 概念 已 不 再 与 实际 相符 。 
所 以 对 于 额外 的 服务 器 ， 称 其 为 缓存 寄存 器 (或 简称 为 缓存 ) 更 合适 一 些 。 一 一 原 书 注 
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9.2.1 基本 问题 


在 CDN 领域 中 ， 大 部 分 复杂 的 数学 模型 都 可 用 于 构造 一 个 具有 成 本 效益 的 分 发 网 ， 
而 设计 这 样 一 个 分 发 网 会 面临 三 个 基本 问题 。 本 节 将 简要 地 介绍 一 下 这 三 个 问题 。 
表 9.1 本 章 使 用 的 符号 汇总 








集合 
I 客户 端 集合 (ICV) 
J 可 以 安装 缓存 服务 器 的 节点 集合 (ICV) 
S 源 服务 器 的 集合 (SCV) 
K 对 象 集合 
参数 
b, WR ke K HK 
Ài 客户 端 ;ie7 的 总 请 求 率 
hy 节点 ie7 发 出 的 能 被 缓存 服务 器 JJ 服务 的 请 求 的 比例 
cy 节点 ieV 和 jeV 之 间 的 距离 ， 即 跳 数 (成 本 ) 
fi AP ic 7 与 缓存 服务 器 Js J 之 间 的 流量 数 
di, 每 单位 时 间 客 户 端 ie7 请 求 对 象 上 es 天 的 请 求 率 
f, 对 节点 je 了 上 一 个 缓存 服务 器 的 操作 成 本 
Vj 将 一 个 对 象 放置 在 一 个 缓存 服务 器 je J 的 成 本 
B; 缓存 服务 器 je J 所 需 带宽 的 单位 成 本 
8j 缓存 服务 器 jeJ 所 需 处 理 能 力 的 单位 成 本 
C; 缓存 服务 器 je/ 可 用 的 计算 能 力 单位 的 个 数 
sj 缓存 服务 器 je J 的 存储 能 力 
$i 对 象 keK 所 消耗 的 带宽 
pu, WR ke K 所 消耗 的 处 理 能 力 
Pk 向 客户 端 提供 对 象 上 se 天 带 来 的 收益 
Li 节点 ieV 和 jeVV 之 间 的 延 时 
As 延 时 的 上 界 〈 可 以 从 一 个 连接 或 一 个 对 象 或 两 者 结合 的 角度 定义 ) 
Ph 对 象 eK 存 在 于 缓存 服务 器 je 天 的 概率 
变量 
Gxe 10, 1) 车 对 对 象 keK 的 请 求 直 接 发 给 缓存 服务 器 JE J 则 为 1!1， 否 则 为 0 
xye |0, 1| 若 客户 端 ie7 被 分 配给 缓存 服务 器 JJ 则 为 1， 否则 为 0 
xa € 10，11 ERY ie PRAM R ke KERER SS je J 上 则 为 1， 否则 为 0 
yje 10, 1} 若 有 一 个 缓存 服务 器 在 节点 JE J 上 处 于 活动 状态 则 为 1， 和 否则 为 0 
z,€ 10, 1| 若 对 象 keK 存在 于 缓存 服务 器 Je J 上 则 为 1， 否 则 为 0 
use {0, 1| PMR ke K 被 复制 (于 任意 缓存 服务 器 je 上) 则 为 1， 否 则 为 0 
ri, 20 访问 被 客户 端 ie7 请 求 且 发 往 缓存 服务 器 JJ BER ke K 的 比例 


1. 缓存 服务 器 的 放置 问题 
对 于 一 个 现 有 的 网 络 设施 ， 缓 存 服务 器 的 放置 问题 是 指 如 何 最 优 地 在 给 定数 量 的 
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站 点 放置 给 定数 量 的 服务 器 ， 使 成 本 函数 (总 流量 、 所 有 客户 端的 平均 延 时 、 总 分 
发 成 本 ) 最 小 化 ”。Qiu 等 人 "提出 了 两 个 数学 模型 来 解决 缓存 服务 器 的 放置 问题 ， 
即 无 容量 限制 的 p - 中 值 “ 1 和 设施 选 址 问题 ，"”! Krishnan 研究 了 如 何 透 明 地 确定 组 
存 的 位 置 。 该 问题 中 考虑 的 目标 函数 很 令 人 感 兴趣 ， 因 为 它 考虑 的 情况 是 被 请 求 的 内 
容 不 在 特定 的 缓存 服务 器 中 。 这 时 ， 服 务 器 j 对 客户 端 i 进行 服务 的 成 本 为 
cost(i,j) = flhscy + (1 - h;) (e; + ¢,) ] (9.1) 

A (9.1) 所 示 的 成 本 函数 很 好 地 描述 了 CDN 的 工作 模式 ， 并 已 被 用 于 解决 其 他 的 
问题 51171。 

2. 对 请 求 的 路 由 

计算 机 网 络 中 的 路 由 是 指 在 实现 网 络 中 总 流量 最 小 的 前 提 下 ， 将 数据 从 一 个 或 多 
个 源 节点 传送 到 一 个 或 多 个 目的 地 。 参 考 文献 [24] 中 对 该 问题 进行 了 详细 的 回顾 ， 
并 给 出 了 组 合 优化 应 用 的 综述 。 另 外 ， 简 单 地 说 “对 请 求 的 路 由 ”是 将 一 个 客户 端 
的 请 求 转 发 到 能 够 对 该 请 求 进行 服务 的 合适 的 缓存 服务 器 的 过 程 。 对 这 个 问题 严格 的 
定义 是 : 对 于 访问 服务 器 上 某 对 象 的 一 个 请 求 ， 选 择 一 个 使 成 本 函数 最 小 的 服务 器 来 
处 理 这 个 请 求 。 这 个 问题 的 数学 公式 (尽管 比较 简单 ) 可 参见 参考 文献 [14] 。 

3. 对 象 存 储 

前 面 提 到 的 研究 都 是 假设 存储 在 源 服 务 器 中 的 内 容 已 完全 复制 到 缓存 服务 器 中 ， 
这 种 情况 下 缓存 服务 器 通常 被 称 为 副本 或 者 镜像 。 不 幸 的 是 ， 如 果 对 象 非常 大 (如 
多 媒体 文件 ) ， 那 么 缓存 服务 器 有 限 的 存储 空间 就 只 能 允许 复制 部 分 的 副本 ， 在 这 种 
情况 下 任何 缓存 服务 器 都 只 能 存储 内 容 的 一 个 子 集 。 在 有 限 的 存储 空间 下 ， 确 定 哪 些 
对 象 应 该 被 放置 到 缓存 服务 器 上 就 是 对 象 放置 问题 ， 该 问题 的 数学 模型 可 参见 参考 文 
a [18], 


9.2.2 综合 问题 


本 节 讨 论 CDN 中 一 些 更 复杂 的 情况 ， 即 上 面 提 到 的 那些 问题 可 能 会 同时 出 现 。 
首先 研究 一 个 没有 源 服务 器 的 网 络 中 的 静态 数据 放置 问题 ， 目 标 是 最 小 化 总 访问 成 本 
(客户 端 fe7 从 节点 jeJ 获 取 对 象 上 es 天 的 成 本 为 六 ducy) . Baev 为 这 个 问题 提出 的 
一 个 数学 模型 为 


(M1) Minimize 2 2 2; b,d, cx (9.2) 
subject to 
apl VielkekK ' (9.3) 
"i <z,  VijelkekK (9.4) 
F bza ss Viel (9.5) 
Zi e 10,1 Vjelkek (9.6) 
xy € 10,1] VijelkekK (9.7) 


在 模型 M1 B, z, 是 一 个 二 值 变 量 ， 当 对 象 ke K 存在 于 缓存 服务 器 je J 中 时 
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z,=1, BA z, =0; 二 值 变量 xj 当 客户 端 ie7 请 求 的 对 象 ke 在 节点 je 有 一 个 副 
本 并 得 到 处 理 时 为 1， 否 则 为 0。 这 个 模型 中 ， 目 标 函 数 (9.2) 表示 对 请 求 进行 响应 
时 所 有 节点 和 对 象 的 总 成 本 。 注 意 ，J = 了 意味 着 每 个 节点 既 充 当 客 户 端 也 作为 一 个 
潜在 的 缓存 服务 器 。 约 束 条 件 (9.3) 表示 每 个 节点 的 请 求 只 能 被 转发 给 一 个 节点 。 
约束 条 件 (9.4) 表示 请 求 只 能 被 分 配给 当前 存储 着 被 请 求 对 象 的 那个 节点 。 最 后 ， 
约束 条 件 (9.5) 与 每 个 节点 je J 有 限 的 存储 空间 5 有关。 

Laoutaris 等 人 ”研究 了 相互 联系 的 两 个 问题 : 对象 向 缓存 服务 器 的 放置 和 节点 
保存 对 象 的 存储 空间 规划 ， 后 者 是 确定 一 个 给 定 的 总 存储 容量 以 何 种 比例 分 配给 网 络 
中 的 每 个 节点 ， 以 实现 所 有 客户 端 与 所 有 被 请 求 对 象 之 间 的 平均 距离 最 小 。 作 者 假设 
所 有 的 对 象 都 是 单位 大 小 。 他 们 的 另 一 个 研究 工作 ”提出 了 一 个 模型 以 解决 CDN 中 
存储 空间 的 分 配 问题 ， 该 模型 考虑 的 问题 包括 缓存 服务 器 的 安装 位 置 、 每 个 缓存 服务 
器 被 分 配 的 存储 空间 以 及 每 个 缓存 服务 器 上 应 存储 哪些 对 象 等 。 这 个 模型 定义 在 一 个 
树 状 网 络 上 ， 每 个 节点 i 都 有 一 组 记 为 a (i) 的 父 节 点 , 一 组 记 为 (i) 的 叶 节点 。 
与 参考 文献 [21] 中 的 符号 不 同 ,使 用 上 面 定义 的 符号 对 该 模型 进行 重 写 ， 得 到 模 
型 M2。 


(M2) Maximize Y A; V dy Y. (c, - c,)x, 
iel keK vea(i) 


subject to 

$ zasl Vielkek (9.8) 

vea(i) 
Y sa s Mz, VielkekK (9.9) 

vel(i) 
5, Y % <D (9.10) 

jeJ keK 

x4,€10,1] VieljeJ,keK (9.11) 
z„e {0,1} VjeJ,keK (9.12) 


可 以 发 现 ， 这 个 模型 与 Baev 等 人 提出 的 模型 Ml 非常 相似 ， 不 同 之 处 在 于 目标 
函数 ， 这 里 的 目标 函数 是 使 对 象 放置 在 缓存 服务 器 上 所 节省 的 成 本 最 大 化 。 约 束 条 件 
(9.8) 和 “(9.9) 与 客户 端 向 缓存 服务 器 的 分 配 有 关 ， 其 中 的 M 是 一 个 充分 大 的 数 。 
约束 条 件 (9.10) 保证 所 有 缓存 服务 器 中 分 配给 对 象 的 存储 空间 的 总 和 不 能 超过 所 
有 缓存 服务 器 的 总 可 用 空间 ， 后 者 记 做 D = 25 o BEAR Laoutaris 等 人 “假设 所 有 的 


对 象 都 是 单位 大 小 ， 那 么 节点 中 可 用 于 存储 对 象 的 空间 大 小 就 等 于 节点 上 放置 对 象 的 
个 数 。 

Nguyen 等 人 "考虑 了 在 共享 网 络 设施 上 配置 CDN 的 问题 ， 并 提出 了 一 个 联合 配 
置 和 对 象 复制 的 模型 ， 实 现存 储 、 请 求 处 理 和 启动 等 方面 的 总 成 本 最 小 化 。 下 面 将 使 
用 本 章 定义 的 符号 来 介绍 这 个 模型 ， 并 引入 如 下 参数 : 一 个 对 象 能 够 以 单位 放置 成 本 
y, 和 单位 带宽 成 本 B, 放置 在 每 个 缓存 服务 器 上 ; 一 个 缓存 服务 器 的 单位 处 理 能 力 成 
本 记 为 6， 且 可 用 的 处 理 能 力 为 C, 个 单位 ， 对 每 个 对 象 的 处 理 消耗 4 个 单位 的 带宽 
和 6, 个 单位 的 处 理 能 力 ; 单位 时 间 内 服务 提供 商 可 以 从 每 个 对 象 上 获 利 p,; 两 个 节 
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点 2 和 j 之 间 的 延 时 记 为 L;， HEREA: 二 值 决策 变量 w 表 示 一 个 对 象 是 否 在 任何 
缓存 服务 器 上 被 复制 ， 变量 世 表 示 客 户 端 i 对 对 象 & 的 请 求 应 该 分 配给 服务 器 jo 
(M3) Maximize > * X P, 一 Y Y V biz, ~ 
tel je] kek je] kek 


2 2 2, (Bl, +8) - DE (9.13) 
tel jeJ kek jeJ 
subject to 
pA r PW, < Cy, VijeJ (9. 14) 
iel 
Y rov, = ud, MViel,kekK (9.15) 
jeJ 
r(L, -A,) <0 VieljeJ,kek (9. 16) 
T < ds VieljeJ,kekK (9. 17) 
yj E 10,1} Vj e J (9. 18) 
u, e 10,1} Vkek (9.19) 
z, e {0,1} VjeJ,keK (9. 20) 


模型 M3 的 目标 函数 是 最 大 化 服务 提供 商 的 收益 ， 其 中 收益 等 于 总 收入 〈 即 式 
(9.13) 的 第 一 个 项 ) 减 去 总 成 本 ， 总 成 本 来 自 存储 、 带 宽 、CPU 以 及 网 站 建设 等 方 
Ho ARRIE (9.14) 是 对 每 个 服务 器 的 容量 约束 ; 约束 条 件 (9.15) 保证 所 有 的 
请 求 都 得 到 响应 。 约 束 条 件 (9.16) 确保 所 有 的 请 求 都 在 允许 的 延 时 内 得 到 响应 。 
EUG, ARAM (9.17) 的 作用 是 保证 只 有 当 缓 存 服务 器 中 存在 被 请 求 对 象 时 ， 请 
求 才能 被 该 缓存 服务 器 响应 。 

Bektas 等 人 研究 了 服务 器 位 置 、 对 象 放 置 和 请 求 路 由 的 问题 。 在 参考 文献 [9] 
中 ， 他 们 提出 了 一 个 新 的 模型 ， 该 模型 考虑 到 多 对 象 ， 并 结合 一 个 合适 的 、 阿 尔 伯 特 
非 线 性 、 类 似 于 式 (9.1) 的 目标 函数 ， 对 标准 的 设施 选 址 模型 进行 了 扩展 ， 使 之 适 
用 于 CDN。 他 们 提出 的 这 个 整数 规划 模型 为 


(M4) Minimize > fy, 十 > > >, [b,d,c;z,x; + b,d,(1— 24) (e + Cy) %% 
jeJ iel jeJ kek 


(9.21) 
subject to 

Fasl Viel (9.22) 

jeJ . 
x,€&y, Mielje]J (9.23) 
Y^uss; Wied (9.24) 

kek a 

y; e 10,1} VjeJ (9. 25) 
x; e {0,1} Wielje J (9. 26) 
z, e {0,1} WieJ, kek (9. 27) 


模型 M4 的 目标 函数 是 将 式 (9. 1) 推广 到 多 客户 端 、 多 服务 器 和 多 对 象 的 情形 。 
模型 中 的 第 一 项 表示 构建 缓存 服务 器 的 总 成 本 ; 第 二 项 由 两 部 分 组 成 : 第 一 部 分 对 应 
于 缓存 服务 器 响应 用 户 请 求 的 成 本 ， 而 第 二 部 分 是 当 缓存 服务 器 中 没有 被 请 求 对 象 
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时 ， 它 从 源 服务 器 获取 该 对 象 的 额外 成 本 。 约 束 条 件 (9.22) 保证 每 个 客户 端的 请 
求 都 被 分 配 到 唯一 的 缓存 服务 器 ; 约束 条 件 (9.23) 表示 只 有 当 该 缓存 服务 器 处 于 
可 用 状态 时 才 可 以 接受 分 配 ; 约束 条 件 (9.24) 确保 向 每 个 缓存 服务 器 放置 对 象 时 
不 会 超出 其 自身 的 存储 容量 。 

Bektaş 等 人 “随后 又 从 实际 操作 层面 出 发 研究 了 这 个 问题 ， 他 们 忽略 了 缓存 服务 
器 的 放置 问题 ， 但 同时 施加 了 一 个 QoS 约束 ， 以 限制 对 象 点 对 点 传输 的 延 时 ， 由 此 提 
出 的 模型 为 

(M5) Minimize y Y Y [5 da cuz x; + bd, (1 — zg) (co + e)a] 


tel jeJ keK 


subject to 
dm = 1 Viel (9. 28) 
2, Lys. * 2 (L; TR -z%) <A, WieljeJ,keK (9.29) 
2. bz, sy, Vie J (9.30) 
Ks = 10,1 Vielje]J (9.31) 
zy e 10,1}  VjeJ,kek (9. 32) 


模型 M5 与 模型 M4 结构 相似 ， 只 是 如 上 所 述 忽 略 了 缓存 服务 器 的 放置 问题 ， 并 
纳入 了 QoS 约束 ， 即 约束 条 件 (9.29) 。 式 (9.29) 可 以 写 为 更 简单 的 形式 : 

MF VieljeJke Z, 
其 中 ， 对 于 每 一 对 (i, j) 有 

Z; = |k e K|L; <4, A(L,+L,) > Ajl 

上 式 中 的 DAMA M PR, CUTOUPBISRHTOIR, RASA EDO ARE 
送 到 发 起 请 求 的 客户 端 上 所 需 的 时 间 LANEY A BÆ, RR ARS BS 
7 没有 该 对 象 ， 则 会 增加 一 个 从 源 服务 器 取 对 象 的 额外 时 间 L。， 且 总 时 间 会 超出 A,。 
所 以 ， 由 于 QoS 的 限制 将 不 允许 缓存 服务 器 从 源 服务 器 中 读 取 该 对 象 。 

以 上 所 有 模型 都 是 假设 CDN 只 有 一 个 源 服 务 器 ， 也 就 是 说 1 S| =1， 这 与 大 多 
数 实际 情况 相 吻 合 。 但 在 某 些 情况 下 ， 内 容 提 供 商 也 许 会 (可 能 在 同一 个 站 点 ) 部 
署 多 个 源 服务 器 ， 其 原因 一 般 是 为 了 增加 系统 的 稳定 性 或 扩大 系统 容量 。 参 考 文献 
[6] 中 提出 了 一 个 模型 ,解决 多 个 源 服务 器 情况 下 缓存 服务 器 放置 、 请 求 路 由 以 及 
对 象 存储 等 问题 ， 该 模型 为 


(M6) Minimize Y fy, 
jeJ 
二 2, b [bdycyzax, + bd, (1 — zp) (eg +c,t,) x, ] 
iel jeJ se ek 


(9. 33) 
subject to 


LE Viel (9. 34) 
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Xs S y; VieljeJ (9. 35) 
2, bita < sy, VieJ (9. 36) 
2.5 =1 VjeJ (9.37) 

y, e 10,1] VieJ (9.38) 
x, e {0,1} Yieljs]l (9. 39) 
zx e {0,1} VieJkek (9. 40) 
t, e 10,1] VieJ,eS (9: 41) 


模型 M6 将 模型 M4 推广 到 多 个 源 服务 器 ， 并 引入 了 一 个 二 值 变量 i: 如 果 缓 存 
服务 器 je J 分 配给 一 个 源 服务 器 se S Mit, —1, Tt, =0。 相 对 于 模型 M4 ， 对 其 目 
标 函 数 进行 了 扩展 ,以 考虑 到 所 有 可 用 的 源 服务 器 。 另 外 ,增加 了 约束 条 件 
(9.37) ， 以 确保 每 一 个 缓存 服务 器 应 该 被 分 配给 唯一 的 源 服务 器 ， 当 缓存 服务 器 上 
不 存在 被 请 求 的 对 象 时 ， 它 将 把 该 请 求 转发 至 相应 的 源 服务 器 。 


9.3 求解 算法 


上 述 问题 以 及 相关 数学 模型 的 求解 算法 有 两 类 。 第 一 类 是 精确 算法 ， 可 以 产生 最 
优 解 ， 但 代价 是 需要 相当 长 的 计算 时 间 ; 第 二 类 是 启发 式 算法 ,计算 量 一 般 相对 较 
小 ， 但 不 幸 的 是 这 类 算法 通常 不 能 保证 得 到 最 优 解 。 在 目前 可 用 的 大 量 第 一 类 算法 
中 ， 本 节 着 眼 于 两 种 基于 分 解 的 算法 ， 因 为 它们 可 以 将 原 问题 分 解 成 小 规模 的 、 更 易 
解决 的 多 个 子 问 题 。 


9. 3.1 Benders 分 解 


Benders 48 ^! 允许 将 问题 分 解 成 两 个 子 问题 。 为 了 介绍 Benders 分 解 ， 假 设 一 
个 给 定 模 型 为 
(P) 最 小 化 cx + fy 4:Ax + By =d,xeX,yeY (9.42) 
其 中 x Aly 是 变量 构成 的 列 向 量 ，c 和 了 是 成 本 系数 构成 的 行 向 量 ，A 和 B 是 约束 系 
UER, d 是 等 号 右 侧 各 值 构 成 的 列 向 量 。 变 量 x Aly 分 别 定义 在 非 空 集合 XY 和 Y 
(假设 前 者 是 连续 的 集合 ， 后 者 是 整数 集合 ) 。 
首先 将 问题 (72) 重 写 为 下 面 的 形式 : 
(P) min [f y + min | ex: AX =d — By} | (9.43) 
yey eX 
其 中 y 预 设 初 值 为 y=》。 既然 问题 中 内 侧 的 那个 仅 与 变量 x 有 关 的 最 小 化 问 
题 (GHP) 是 线性 且 连 续 的 ， 所 以 在 的 每 个 约束 条 件 中 可 以 用 x 的 对 偶 变量 w 
对 x 进行 替换 ， 得 到 式 (9.44) : 
min | fy + max|w(d -B Y): wA <c} | (9. 44) 


Jey 
假设 多 的 对 偶 问 题 的 可 行 域 是 非 空 的 〈 和 否则 就 意味 着 原 问 题 无 解 或 无 界 ) ， 原 问 
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gi (7) 可 以 重 写 为 


Minimize z+fy (9.45) 
subject to 
z=7(d-By) rey (9. 46) 
¿č (d-By) «0 few (9.47) 
yeY (9.48) 


重 写 后 的 问题 称 为 主 问 题 。 对 偶 问题 的 可 行 解 空 间 的 极点 和 极 射 线 分 别 用 y AW 
示 。 约 束 条 件 (9.46) 是 针对 多 的 对 偶 问 题 的 可 行 域 的 每 一 个 极点 ， 而 约束 条 件 
(9.47) 针对 的 是 与 对 偶 问 题 的 不 可 行 解 相对 应 的 每 一 个 极 射线 。 

参考 文献 [8] 指出 ,模型 M5 有 一 个 特殊 的 结构 ， 使 其 可 以 应 用 Benders 分 解 。 
这 里 引入 辅助 的 线性 变量 wx ， 对 应 于 模型 M5 的 目标 函数 中 的 乘积 项 x;zj,， 下 面 将 以 
模型 M5 的 线性 情况 为 例证 明 这 一 点 ,细节 参见 参考 文献 [8]. 


Minimize * * X [ bAg (e + 64); — bAntopy | (9. 49) 
tel jeJ kek 
subject to 

Tuya, Wied (9. 50) 

jeJ 
Y ba, <s; VieJ (9.51) 

kek 
Pu —% S0 VieljeJ kek (9. 52) 
Pix Za SO VieljeJkekK (9. 53) 
Xj -Zr S0 VieljeJke@, (9.54) 
x, 20 VieljeJ (9.55) 
z, € {0,1} VieJ,kek (9.56) 
ea € 10,1] VieljeJkek (9. 57) 


将 上 述 线性 模型 中 的 对 象 位 置 变 量 固定 取 值 为 z= oz, ， 得 到 的 子 问题 能 够 进 一 
步 以 每 个 客户 端 ie 7 为 单位 分 解 为 更 小 的 问题 : 


Minimize > EZAC * Cjo) Xj ~ bi AnljoPin | (9. 58) 
jeJ kek 
subject to 

> i, = (9. 59) 

jeJ 
Q4 -x, S0  VjeJ,kek (9. 60) 
Pin S zs Vje Jk e Z, (9.61) 
X, Sz Vj e J,ke Z (9. 62) 


x, 20 VijeJ 
尽管 每 个 子 问题 仍 是 整数 规划 问题 ， 但 具有 完整 性 的 特性 。 这 个 特点 使 对 变量 
% 的 约束 可 以 放宽 ， 从 而 求解 其 对 偶 。 令 约束 条 件 (9.59) ~ (9.62) 的 对 偶 变 量 
DNA a. On, On FIL, PIER 
Minimize 2.6 (9.63) 
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subject to 
+ VV aly +h) 0  (a86e4)e27 (9. 64) 
gel *eK 
a - 3 Daal On + en) <0, (a,0,0,£) e Y” (9.65) 
je eK 


Y hey, <s, VieJ 
z, € {0,1} VieJ,kek 
KB, XX (9.64) 为 使 用 对 偶 问题 最 优 解 的 对 应 系数 时 的 最 优 约束 ， 计 算 公式 为 


min | 2, bida (cy fij 一 l N bidaa | 
à, - ren dino 
ijk 0, 
Y ds =a, + $ 0 — Y bae; + Co) VijeJ 

RP, Z = |j e J| Z = R=) B = ljeJlz =1,Vke J). ARRIE 
(9.65) 针对 的 是 对 偶 问 题 的 不 可 行 解 所 对 应 的 每 个 极 射 线 。 鉴 于 主 问 题 中 最 优 性 和 
不 可 行 性 约束 条 件 的 数量 ， 故 对 这 个 问题 的 求解 是 不 现实 的 。 因 此 ， 需 要 求助 于 这 样 
一 个 策略 : 从 只 包含 有 限 约束 条 件 的 受 限 主 问题 开始 ， 新 的 约束 条 件 迭 代 地 加 入 这 个 
受 限 问题 ， 直 到 求 出 最 优 解 。 参 考 文献 [8] 中 介绍 了 这 个 方法 的 细节 ， 以 及 各 种 提 
高 算法 效率 的 精 调 方法 ， 如 使 用 帕 累 托 优化 约束 及 约束 的 去 除 。 


9.3.2 拉 格 朗 日 松弛 和 分 解 


拉 格 朗 日 松弛 可 以 将 一 个 模型 中 的 部 分 约束 条 件 以 拉 格 朗 日 形式 对 偶 化 〈 松 
弛 ) ， 以 变换 为 一 个 易 解 的 问题 。 考 虑 前 面 提 到 的 问题 假设 Ax + By =d 是 那些 使 
模型 “复杂 ”的 约束 条 件 ， 引 入 一 个 拉 格 朗 日 乘 数 向 量 人 ， 可 以 将 这 些 约束 条 件 对 偶 
化 为 


^v 
a; = 


(Z5) Minimize cx + fy + u(Ax + By - d) 
subject to xeX,yeY 
引入 松弛 向 量 后 ， 可 以 很 容易 地 将 A 直接 分 解 成 两 个 子 问题 ， 其 中 只 涉及 变量 
x 的 子 问题 为 
min(¢ +pA)x 
另 一 个 只 涉及 变量 y 的 子 问题 为 
min(f * uB)y 
XT u AERA EMA, D. 的 解 都 是 其 最 优 解 的 一 个 下 界 。 为 了 寻找 这 个 下 界 ， 
需要 求解 分 段 线性 凹 优化 问题 maxZ ， 这 个 问题 称 为 拉 格 朗 日 对 偶 问题 ， 可 以 通过 不 
可 微 优化 技术 求解 。 
拉 格 朗 日 松弛 法 可 以 解决 前 面 提 到 的 一 些 问题 ， 如 Qiu 等 人 提出 的 服务 器 放 
置 问题 、Nguyen 等 人 C) 提 出 的 覆盖 分 布 网 络 的 配置 问题 以 及 Bektas 等 人 ” 提 到 的 对 
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象 放置 和 请 求 路 由 问题 。 本 节 介 绍 这 个 技术 如 何 应 用 于 参考 文献 [8] 中 提出 的 一 个 
整数 线性 规划 模型 ， 不 过 使 用 的 是 另 一 种 类 型 的 松弛 方法 。 下 面 给 出 的 模型 是 引入 畏 
助 变量 几 后 模型 M5 的 一 个 线性 化 变形 。 


Minimize >, Y Y bas; + Ot, — Y > Us (9. 66) 
tel jeJ kek jeJ kek 
subject to 

Sal Wiel (9. 67) 

jeJ 
》 bass  VjeJ (9. 68) 

kek 
v, - Mz, <0 VieJ,kek (9. 69) 
vy — >, bAa <0 Vie Jk ek (9. 70) 

iel 

Xa Zy SO VieljeJ,ke Zj (9.71) 
x, 20 VieljeJ (9. 72) 
z, e 10,1} VieJ,kekK (9. 73) 
v, 20 VieJ,kek (9. 74) 


使 用 拉 格 朗 日 乘 数 o,、m 和 ;分别 对 约束 条 件 (9.67), (9.69) 和 (9.70) 进 
行 对 偶 化 ， 可 得 松弛 后 的 问题 A: 


(Z) Minimize $ $ ( Y ibd,[e; +eo(1 - m)]} -cx 


el jeJ 

* Y Y GG 9,71), - MY, Y nza- o. (9. 75) 
jeJ keK jel kek tel 
subject to 
Y bg Ss, VjeJ (9. 76) 
keK 

X; —z, S0 Viel,jeJ,ke Ž; (9, 77) 
x, 20 VieljeJ (9. 78) 
z, € 10,1] VjeJ,kekK (9. 79) 
v, 20 VieJ,kek (9. 80) 


问题 A 可以 分 解 成 两 个 子 问题 : 一 个 只 涉及 变量 x 和 z， 另 一 个 只 涉及 变量 vo 
后 者 可 以 通过 确定 来 求解 : 如 果 Ti + Nis =f JER, 则 Vix =0, 否则 vy = le 至 于 前 
一 个 子 问 题 ， 注 意 到 变量 x 只 在 约束 条 件 (9.77) 和 (9.78) 中 出 现 ， 因 此 可 以 这 


^ 
> 


样 确定 变量 x: 如 果 2, dile, *cy(1-9,)]l - o, IER, Wa, =0 ， 和 否则 xy = zx， 


其 中 z 是 下 面 这 个 问题 的 解 : 
Maximize Y 2 Taz, 


jeJ 
subject to 
2,5 X s, VjeJ 
eK 
z, e {0,1} VijeJkek 


J 


而 这 个 问题 又 可 以 进一步 分 解 为 一 系列 二 值 背 包 问 题 ， 对 应 于 每 个 Je J 都 是 一 
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个 背包 问题 ， 可 以 使 用 动态 规划 方法 在 0 (I KI s) 的 时 间 内 解决 。 
9.3.3 启发 式 算法 


与 精确 算法 相反 ， 启 发 式 算法 是 一 种 快速 和 灵活 的 求解 方法 ， 可 以 适用 于 精确 算 
法 无 能 为 力 的 场合 ， 如 CDN 提供 商 的 问题 。 贪 焚 启 发 式 算法 是 一 种 启发 式 算 法 ， 它 
对 于 给 定 的 问题 ， 可 以 在 每 一 步 迭 代 中 从 所 有 可 能 的 蔡 代 方案 中 选择 最 好 的 那个 ， 即 
能 够 最 大 限度 地 降低 成 本 的 那个 。 但 是 ， 这 类 方法 不 能 保证 得 到 的 结果 具有 全 局 最 优 
性 ， 因 此 大 多 数 情 况 下 只 能 获得 局 部 最 优 解 。 不 过 ， 这 类 启发 式 算法 的 优势 在 于 处 理 
问题 时 的 计算 速度 以 及 解决 非常 大 的 问题 时 的 灵活 性 ， 这 就 解释 了 贪 禁 启 发 式 算法 为 
什么 能 在 CDN 中 得 到 广泛 应 用 “”"” 。 近 似 算法 是 另 一 种 启发 式 算法 ， 可 以 保证 
得 到 的 解 与 最 优 解 之 间 的 差距 在 一 个 常数 比例 之 内 ， 这 种 方法 在 CDN 中 的 应 用 参见 
参考 文献 [4，20] 。 模 拟 退 火 算法 和 禁忌 搜索 算法 是 更 复杂 的 启发 式 算法 ， 称 为 超 
启发 式 算法 ， 它 们 采用 特定 的 机 制 防止 对 解 的 搜索 陷入 局 部 最 优 。 参 考 文献 [7] 中 
提出 了 模拟 退火 算法 的 一 个 两 级 实现 ， 用 于 解决 对 象 放 置 和 请 求 路 由 问题 。 禁 忌 搜索 
算法 在 相同 问题 上 的 一 个 应 用 可 参见 参考 文献 [15]. 

表 9.2 给 出 了 目前 CDN 在 资源 分 配 和 管理 中 使 用 的 各 种 模型 和 解决 方案 ， 如 服 
务 器 放置 (SP) 、 请 求 路 由 (RR), HAKE (OP) 以 及 内 容 分 发 (CD), ， 同 时 包 
括 一 些 相 关 的 文献 。 

表 9.2 现 有 模型 及 求解 方法 的 分 类 

服务 器 放置 
动态 规划 
拉 格 朗 日 松弛 ， 贪 禁 启 发 式 
SR AE RA 
TRAE RX 
动态 规划 
整数 规划 模型 
SUE RK 
RAE AC 
精确 算法 、 近 似 算法 
RAE RX 
启发 式 算法 
动态 规划 
启发 式 算 法 
近似 算法 
启发 式 算法 
解析 式 算 法 、 启 发 式 算法 
模拟 退火 
Benders 分 解 、 拉 格 朗 日 松弛 
禁忌 搜索 


拉 格 朗 日 松弛 
Bender fft, RARA 
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9.4 其 他 CDN 架构 使 用 的 新 模型 


前 面 章节 介绍 的 大 多 数 模型 都 基于 各 种 不 同 的 CDN 架构 。 为 了 建 模 的 方便 ， 
对 这 些 模型 使 用 了 严格 的 约束 ， 这 使 它们 都 有 各 自 的 局 限 性 。 本 节 将 提出 一 种 新 
的 模型 ， 用 于 更 普遍 的 情形 ， 从 数学 建 模 的 角度 来 说 这 项 工作 尚 属 首创 。 为 了 方便 对 
模型 的 描述 ， 这 里 使 用 一 个 小 规模 的 例子 。 该 例 中 ， 网 络 结构 由 单个 源 服务 器 
(ISI =1)、3 个 缓存 服务 器 (J= 11, 2, 31) 以 及 10 个 客户 端 (T= 01,2, 
10}) 组 成 ， 网 络 拓扑 如 图 9.1 所 示 。 在 这 个 例子 中 ， 假 设 网 络 中 分 布 着 5 个 对 象 
(K= {1, 2, +, 51), EMA (HEA CB) 分 别 为 6, 594, b, 275, b, =96、 
b, =61 及 b, =82。 缓 存 服务 器 的 容量 分 别 设 置 为 s = 156, s, 2162 Rs, =85 (单位 同 
FE GB) ， 其 大 小 占 所 有 对 象 总 大 小 的 比例 从 20% 到 40% 不 等 。 对 于 任意 的 zs7 和 /7 
e J， 节 点 之 间 的 距离 cy 在 1 ~5 之 间 随 机 取 值 (距离 矩阵 参见 附录 中 的 表 9.4) ， 而 
每 个 缓存 服务 器 和 源 服务 器 之 间 的 距离 设 定 为 c/。=20、c,。=15 Ke, ,=18。 为 简 
单 起 见 ， 假 设 每 个 客户 端 对 每 个 对 象 的 请 求 率 都 相同 ( 即 对 所 有 的 ieT 和 keK 有 
d, m1); 





会 源 服务 器 
e 缓存 服务 器 
um 客户 端 


图 9.1 样 例 网络 的 拓扑 架构 


使 用 模型 M4 求解 样 例 问题 ， 并 将 其 作为 基准 。 对 于 本 节 所 有 的 模型 ， 都 使 用 最 
新 的 非 线 性 整数 规划 求解 器 BONMIN ”在 NEOS 服务 器 在 线 完成 求解 2。M4 的 最 优 解 
如 图 9. 2 所 示 ， 其 中 客户 端 到 服务 器 的 分 配 用 粗 连 线 表示 ， 对 象 在 每 个 缓存 服务 器 的 
放置 也 可 从 图 中 看 到 ， 求 解 的 总 成 本 为 31229 。 


© BW https; //projects. coin - or. org/Bonmin, 原 书 注 
© ÆJ neos. mcs. anl. gov/neos/solvers/minco: Bonmin/AMPL. html, — JHH} 
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图 9.2 使 用 模型 M4 得 到 的 样 例 问题 的 解 


9.4.1 从 多 服务 器 获取 对 象 


在 前 面 提出 的 模型 中 通常 假定 CDN 的 结构 为 : 一 个 客户 端 ie 7 被 分 配给 单个 组 
存 服 务 器 je (以 下 称 主 服务 器 ) ， 从 主 服务 器 可 获取 所 请 求 的 对 象 。 当 被 请 求 的 对 
象 不 在 主 服务 器 je J 中 时 ， 主 服务 器 将 请 求 转发 给 源 服务 器 以 获取 对 象 。 当 缓存 服 
务 器 数量 很 多 ， 且 从 其 他 缓存 服务 器 获取 对 象 的 管理 成 本 比较 高 时 ， 这 样 的 策略 可 能 
比较 恰当 。 但 是 ， 当 存在 着 大 量具 有 相似 请 求 率 的 对 象 ， 且 缓存 服务 器 的 存储 空间 有 
E (意味 着 将 有 大 量 请 求 转发 给 源 服务 器 ) 时 ， 这 么 做 可 能 并 非 总 是 一 个 可 行 的 选 
择 。 为 了 解决 这 个 问题 ， 可 以 采用 另 一 种 策略 ， 即 只 有 当 对 象 在 任何 缓存 服务 器 上 都 
不 存在 时 ， 才 将 客户 端 对 该 对 象 的 请 求 转发 给 源 服务 器 (参见 Datta SA 的 工作 )。 
这 意味 着 ， 每 个 客户 端 可 以 从 其 他 的 缓存 服务 器 中 获得 对 象 。 但 这 时 就 会 出 现 第 二 个 
问题 : 如 果 所 有 的 缓存 服务 器 中 都 没有 被 请 求 对象 时 该 如 何 应 对 ? 为 了 解决 此 问题 ， 
首先 做 出 以 下 约束 : 客户 端的 请 求 只 能 通过 其 主 服务 器 转发 给 源 服务 器 〈 本 节 随 后 
会 讨论 放宽 此 约束 时 的 情况 ) 。 此 时 模型 为 


(M7) Minimize 2 >; » b,d,cix 


iel je] keK 


: 2 ADY [bd c, + cp)xy(1 - $300 (9.81) 


subject to 
$5,251 Viel (9. 82) 
jeJ 
$ x, €1 Vielkek (9.83) 
jeJ 
È biza < 5 VjeJ (9. 84) 
eK . 
X^ > ty VieljeJ,keK (9. 85) 
je 
Xa SZ VieljeJ,kek (9. 86) 
ty +2, —% Sl VieljeJ,kek (9. 87) 
x, e 10,1] VieljeJ (9. 88) 


xa, € 10,1] VieljeJ,kekK (9. 89) 
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zy € 0,1} Vie Lee kK (9.90) 

在 模型 M7 中 ， 目 标 函 数 由 两 部 分 组 成 。 第 一 部 分 表示 直接 从 〈 多 个 ) 缓存 服务 
器 对 客户 端 进行 服务 的 成 本 ， 第 二 部 分 表示 只 有 当 其 他 的 缓存 服务 器 上 都 没有 被 请 求 
的 对 象 时 ， 主 服务 器 才 把 请 求 转 发 给 源 服务 器 ， 即 对 于 所 有 的 JsJ 有 了 有 =0， 也 就 是 
说 ， 下 式 成 立 : 

UL- 包 sa)= 1 

约束 条 件 (9.82) 表示 每 个 客户 端 向 其 主 服务 器 的 分 配 ; 约束 条 件 (9.83) 限 
定 每 个 客户 端 至 多 只 从 一 个 缓存 服务 器 获取 每 个 对 象 ; 约束 条 件 (9.86) 确保 请 求 
只 能 由 拥有 被 请 求 对 象 的 单个 缓存 服务 器 进行 服务 ; 对 每 个 缓存 服务 器 存储 容量 的 限 
制 体现 在 约束 条 件 (9.87) 中 ， 对 于 任何 请 求 该 约束 条 件 给 出 了 在 拥有 对 象 的 情况 
F (BUR x, =z =1， 则 xj =1)， 主 服务 器 处 理 请 求 的 优先 级 。 模 型 M7 的 解 如 图 
9.3 所 示 ， 其 最 优 解 为 14001 ， 与 M4 模型 相 比 降低 了 大 约 55% 。 

在 图 9.3 中 ， 客 户 端 向 主 服 务 器 的 分 配 由 粗 连 线 表 示 ， 而 路 由 到 其 他 服务 器 的 请 
求 由 细 连 线 表 示 ( 即 客户 端 1、3、4 和 5 分 配给 缓存 服务 器 2， 但 它们 从 缓存 服务 器 
1 中 获得 对 象 1 和 4， 这 是 因为 它们 的 主 服务 器 中 没有 这 些 对 象 ) 。 在 这 个 例子 中 ， 任 
何 对 于 对 象 2 的 请 求 不 得 不 最 终 由 源 服务 器 进行 服务 ， 因 为 没有 一 个 缓存 服务 器 拥有 
该 对 象 。 客 户 端 1、3、4 和 5 通过 它们 的 主 服务 器 (2 号 ) 获得 对 象 2， 而 客户 端 2 
和 6 通过 它们 的 主 服务 器 (3 号 ) 获取 该 对 象 。 





\ 
| 
图 9.3 使 用 模型 M7 得 到 的 样 例 问 题 的 解 
为 了 使 分 发 策略 具有 更 多 的 灵活 性 ， 下 面 提出 另 一 种 模型 ; 允许 客户 端的 对 象 请 求 
可 以 被 网 络 中 的 任何 缓存 服务 器 转发 〈 并 服务 ) 。 在 这 个 模型 中 ， 定 义 了 一 个 新 的 二 值 
变量 ws ， 如 果 源 服务 器 经 由 缓存 服务 器 ) 将 对 象 & 送 达 客 户 端 i, vj 为 1， 和 否则 为 0。 
(M8) Minimize 2; 2. 2s [bidicyxi + bd (c; + cy) 4] 





subject to 
2, (Hm + ng) =1 Viel,kek (9.91) 
je 
Y bit. X s VjeJ (9.92) - 
kek 


Xa X x VieljeJ,kek (9,93) 
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?a Sl -z VieljeJ,kekK (9.94) 
Xin Vy, € 10,1] VieljeJ,kek (9.95) 
z, e {0,1} VieJ,kek (9. 96) 


模型 M8 的 目标 函数 由 两 部 分 组 成 ， 第 一 部 分 表示 对 象 从 缓存 服务 器 传送 到 客户 
端的 总 成 本 ， 第 二 部 分 表示 从 源 服务 器 获取 对 象 的 成 本 。 约 束 条 件 (9.91) 确保 客 
户 端 请 求 的 任何 对 象 ， 要么 直接 从 一 个 缓存 服务 器 得 到 ， 要 么 经 由 某 个 缓存 服务 器 从 
源 服务 器 得 到 ; 约束 条 件 (9.92) 对 缓存 服务 器 的 容量 进行 限制 ; 约束 条 件 (9.93) 
表示 ， 只 有 当 一 个 缓存 服务 器 拥有 被 请 求 对 象 时 ， 客 户 端 才能 得 到 该 缓存 服务 器 的 服 
务 ; 约束 条 件 (9.94) 确保 ， 只 要 至 少 有 一 个 缓存 服务 器 je J 拥有 被 请 求 对 象 ， 则 
该 对 象 就 不 能 由 源 服 务 器 提 
供 。 模 型 M8 的 解 如 图 9.4 所 
ZR, 最 优 解 为 13940， 比 M7 
得 到 的 解 还 要 低 。 图 9.4 中 显 
示 的 结果 体现 了 使 用 该 模型 后 
分 发 过 程 具 有 的 灵活 性 ， 任 何 
客户 端 都 能 从 (或 经 由 ) 任 
何 服务 器 接收 到 任何 对 象 。 例 
如 ， 客 户 端 1 从 缓存 服务 器 1 
中 接收 到 对 象 1， 从 缓存 服务 图 9.4 使 用 模型 M8 得 到 的 样 例 问题 的 解 
器 2 中 得 到 对 象 3 和 4， 从 缓存 服务 器 3 中 得 到 对 象 5， 通 过 缓存 服务 器 2 得 到 对 象 2 
(该 缓存 服务 器 将 请 求 转发 给 了 源 服务 器 ) o 


9.4.2 CDN 的 生存 力 设计 . 


远程 通信 网 络 的 生存 力 (Survivability) 是 指 其 在 一 条 链 路 或 一 个 服务 器 失效 时 的 
运行 能 力 。 对 于 前 者 ， 目 前 已 有 很 多 相关 文献 进行 了 研究 ( 如 参考 文献 [25] ) 。 在 设 
计 CDN 时 可 以 采纳 其 研究 成 果 ， 在 客户 端 和 服务 器 之 间 建 立 备用 连接 ， 以 便当 主 连 接 
失效 时 激活 该 备用 连接 。 而 对 于 后 者 ， 则 与 本 章 的 工作 非常 相关 ， 因 为 上 面 提出 的 模型 
都 是 基于 这 样 的 假设 ， 即 每 个 客户 端 都 连 到 单个 缓存 服务 器 ， 并 通过 该 缓存 服务 器 得 到 
相应 的 服务 。 当 主 服务 器 失效 时 ， 客 户 端 需要 立即 由 另 一 个 缓存 服务 器 服务 ( 即使 被 请 
求 的 对 象 并 不 在 该 服务 器 中 ， 因 为 缓存 服务 器 只 是 充当 了 一 个 通 往 源 服务 器 的 中 转 )。 
所 以 ， 一 个 CDN 若 想 具有 生存 力 ， 就 需要 这 样 的 设计 : 每 个 客户 端 都 应 分 配给 一 个 备 
用 的 (或 随时 待命 的 ) 服务 器 ， 这 样 当 主 服 务 器 失效 时 ， 请 求 应 该 转向 备用 服务 器 。 
基于 上 述 分 析 ， 根 据 生 存 力 的 要 求 对 模型 M7 进行 扩展 ， 得 到 的 新 模型 为 

(M9) Minimize 2 

+ >》 >》 这 [bydycy24x% + Ody (1 — zn) (cs + ci) 


y», > b [bydyc,zyxy, + bida(l - za) (cs + e,)m;] (9.97) 
iel jeJ kek 
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subject to 

Sael Viel (9. 98) 

jeJ 
Yasil Viel (9.99) 

jel 
xXp4x,?*y VieljeJ (9. 100) 
È, bite S sj, VjeJ (9. 101) 
ye 10,1} YVjeJ (9. 102) 
Xi € 10,1} VtelJje]J (9. 103) 
z, € 10,1] VJ e J,k ek (9. 104) 


在 模型 M9 H, x dt (Ae: 当 服 务 器 j 是 客户 端 i 的 主 服务 器 时 ， 其 值 为 1， 
否则 为 0。 太 是 另 一 个 二 值 变 量 ， 当 缓存 服务 器 j 是 客户 端 i 的 备用 服务 器 时 ， 值 为 1， 否 
则 为 0。 目 标 函 数 (9.97) 中 的 前 两 项 与 M4 类 似 ， 第 三 项 表示 当 发 生 故 障 时 向 客户 端 提 
供 备 用 服务 的 成 本 。 因 为 发 生 故 障 的 频率 不 一 定 很 高 ， 所 以 该 成 本 不 会 经 常 发 生 ， 可 以 使 
用 参数 0<y<1 调节 备用 服务 器 成 本 对 CDN 设计 的 影响 。 这 样 ， 当 y =0 时 ，CDN 提供 商 
就 不 用 考虑 向 其 客户 提供 备用 服务 器 的 成 本 ; 当 Y =1 时 ， 总 成 本 包括 提供 备用 服务 器 的 
成 本 〈 即 使 服务 也 许 根本 不 会 使 用 ) 。 在 该 模型 中 ， 约 束 条 件 (9.98) 与 主 服务 器 的 分 配 
有 关 ， 而 约束 条 件 (9.99) 确保 每 个 客户 端 也 同时 被 分 配 到 一 个 备用 服务 器 。 约 束 条 件 
(9.101) 是 对 处 于 激活 状态 的 缓存 
服务 器 施加 的 容量 限制 。 使 用 模型 
M9 对 样 例 求解 ， 得 到 的 结果 如 图 
9.5 所 示 ， 当 7y =0.7 时 最 优 解 为 
55561.7, 4 y = 0.3 时 最 优 解 则 
为 41657.3。 

如 图 9.5 所 示 ， 主 服务 器 的 
分 配 用 粗 连 线 表示 ， 备 用 服务 器 
的 分 配 用 虚 连 线 表示 。 对 于 客户 图 9.5 
端 1 来 说 ， 缓 存 服务 器 2 作为 其 
主 服 务 器 ， 当 它 失 效 时 客户 端 1 立刻 被 路 由 到 缓存 服务 器 1。 


9.5 性 能 结果 


为 了 方便 读者 查看 新 模型 M7 ~ M9 的 计算 性 能 ， 本 章 给 出 的 是 运行 在 一 组 样 例 下 
的 部 分 计算 实验 的 结果 。 这 些 样 例 的 产生 方式 与 参考 文献 [9] 中 的 方式 相同 ， 都 是 
基于 一 个 具有 3 个 缓存 服务 器 和 10 个 客户 端的 网 络 。 被 分 发 对 象 的 数量 在 20 ~ 90 之 
间 变 化 ， 间 隔 为 10。 此 例 中 ， 对 象 请 求 率 并 不 均匀 ， 而 是 根据 Zipf - like 分 布 产生 
(参见 参考 文献 [12，32] ) ， 其 形式 为 Pr(i) = 01, 其 中 0 = (F 是 归 一 化 
常量 ， 分 布 的 参数 设 为 =0. 733, i 





使 用 模型 M9 得 到 的 样 例 问题 的 解 
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实验 结果 在 图 9.6 中 给 出 ， 图 中 显示 了 使 用 模型 M4, M7, M8 和 M9 得 到 的 解 
(运行 2 次 ，y 分 别 为 0.3 和 0.7) 。 如 图 所 示 ， 模 型 M7 和 M8 的 性 能 很 相似 ， 都 比 
M4 的 结果 要 好 。 另 外 ， 由 于 引入 了 生存 力 ，M9 的 解 具有 很 高 的 成 本 。 求 解 这 些 模 型 
所 花费 的 时 间 如 表 9.3 所 示 。 这 些 值 意味 着 ， 即 使 问题 的 规模 很 小 ，M7 和 M8 的 求 
解 也 被 证 明 是 非常 困难 的 。 实 际 上 ， 以 1 KI =80 和 | KI =90 为 例 ， 这 些 模 型 的 最 
优 解 也 无 法 在 lh 内 计算 完成 (图 9.6 中 的 数值 是 在 这 个 时 间 限 度 内 可 能 获得 的 最 好 
结果 ) AERO. 3 中 显示 的 数值 意味 着 其 他 模型 的 求解 时 间 应 该 会 随 着 样 例 规 模 的 
增 大 而 变 长 ， 但 它们 对 于 这 些 样 例 则 更 易于 求解 。 





17300.00 
15300.00 
13300.00 
11300.00 
9300.00 
7300.00 
5300.00 
3300.00 
1300.00 

20 30 40 50 60 70 80 90 
图 9.6 各 个 模型 在 样 例 下 的 成 本 比较 
表 9.3 各 个 模型 在 样 例 下 的 求解 时 间 (s) 

NL | JI | KI M4 M7 M8 M9 (0.3) M9 (0.7) 
3 10 20 0. 02 230.48 161.29 0. 05 0. 23 
3 10 30 0. 05 256.54 — 679.54 0. 09 0. 42 
3 10 40 0.31 118. 17 88. 29 1.19 0. 50 
3 10 50 0.34 161.58 418.15 0. 29 0. 21 
3 10 60 0. 16 1764.42 1867. 74 1.01 0.77 
3 10 70 0. 13 384.59 395.48 0. 13 0.79 
3 10 80 0.27 3600.00 3600. 00 1. 80 1.94 
3 10 90 0. 45 3600.00 3600.00 1.23 3. 90 





9.6 写 给 使 用 者 


很 明显 ， 对 于 一 个 像 CDN 这 样 的 动态 和 活路 的 环境 ， 大 多 数 应 用 都 需要 快速 、 
可 扩展 的 方法 。 在 所 有 这 类 方法 中 ， 启 发 式 方法 是 一 种 普遍 使 用 的 方法 ， 贪 焚 启 发 式 
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方法 5 、 拓 扑 结构 已 知 的 启发 式 方法 “或 者 热点 算法 “已 广泛 用 于 缓存 服务 器 定位 
问题 。 不 过 ， 虽 然 可 以 说 这 种 启发 式 方法 优 于 另 一 种 启发 式 方法 ,但 对 于 这 些 方 法 得 
出 的 解 的 质量 ， 目 前 并 没有 一 个 评估 的 指标 。 本 章 的 目的 是 强调 使 用 数学 模型 特别 是 
精确 算法 来 解决 CDN 问题 的 重要 性 ， 并 使 读者 认识 到 使 用 这 些 方法 是 有 好 处 的 。 的 
确 ， 数 学 模型 可 以 用 做 基准 ， 从 解 的 质量 角度 评估 各 种 启发 式 方法 ， 这 自然 有 助 于 在 
实际 中 选择 合适 的 启发 式 方法 。 例 如 ，Laoutaris 4& AU 就 采用 这 样 的 方式 ， 通 过 与 
一 个 精确 算法 进行 比较 ， 对 一 个 贪 焚 算法 〈 及 其 变种 ) 的 性 能 进行 评估 。 

对 于 CDN 在 实际 中 出 现 的 各 种 问题 ， 利 用 数学 建 模 技术 也 可 以 加 深 对 这 些 问题 
的 理解 ， 以 决定 采用 何 种 缓解 措施 。 例 如 ，Nguyen 等 人 ”在 数学 建 模 的 基础 上 ， 使 
用 了 一 个 基于 拉 格 朗 日 方法 的 求解 算法 来 评估 对 象 聚 类 对 CDN 提供 商 总 收入 的 影响 . 

最 后 ， 数 学 模型 可 以 很 容易 地 增 减 约束 条 件 或 更 改 问 题 的 参数 ， 这 种 灵活 性 方便 
了 对 各 种 场景 的 分 析 ， 也 有 助 于 决策 者 选择 合理 的 方案 。 例 如 ， 一 个 CDN 提供 商 可 
能 希望 在 特定 的 参数 设置 下 ， 对 不 同 的 路 由 策略 或 对 象 放置 策略 进行 评 佑 。 尽 管 启 发 
式 方法 也 可 以 实现 这 一 点 ,但 与 使 用 数学 模型 获得 的 结果 相 比 ， 启 发 式 方法 获得 的 结 
果 可 能 不 够 精确 ， 因 为 启发 式 方法 获得 的 解 的 质量 并 不 总 是 已 知 的 。 


9.7 未 来 研究 方向 


未 来 在 CDN 建 模 方面 的 研究 可 分 为 两 个 主要 的 方向 : 提出 新 的 模型 和 对 现 有 算 
法 的 改进 。 对 前 者 而 言 ， 本 章 提出 的 新 模型 表明 ， 确 实 有 一 些 场景 尚未 被 建 模 ， 这 也 
意味 着 实际 中 极 有 可 能 出 现 更 复杂 的 场景 ， 并 由 此 可 能 发 展 出 其 他 的 一 些 模型 。 在 这 
方面 的 建议 是 ， 将 生存 力 问 题 或 缓存 服务 器 的 放置 决策 引入 模型 M7 或 M8， 或 者 将 
QoS 约束 〈 如 参考 文献 [8] 中 的 那些 约束 ) 引入 模型 M7 ~ M9。 这 种 尝试 无 疑 会 导 
致 更 复杂 的 模型 ， 而 这 些 模型 很 可 能 会 表现 为 非 线性 整数 规划 的 形式 。 

本 章 通过 定量 实验 证 明 ， 即 使 对 于 小 规模 的 问题 而 言 ，M7 或 M8 等 模型 的 求解 
也 是 非常 困难 的 ， 这 就 要 求 设计 出 新 的 精确 算法 ， 以 高 效 地 求解 这 些 复杂 的 模型 。 在 
精确 算法 的 问题 上 ， 基 于 分 解 并 结合 线性 化 策略 的 方法 ， 对 于 非 线性 模型 来 说 是 一 个 
有 希望 的 研究 方向 。 然 而 ， 这 些 精确 算法 很 可 能 无 法 解决 较 大 规模 的 问题 ， 这 就 需要 
研究 快速 和 高 扩展 性 的 启发 式 方法 。 启 发 式 方法 和 精确 算法 的 研究 应 该 同时 进行 ， 互 
为 补充 。 事 实证 明 ， 在 某 些 问题 上 "这 种 策略 非常 有 助 于 开发 出 更 好 的 方法 。 


9.8 结论 


本 章 简要 介绍 了 在 CDN 资源 ( 网络、 缓存 服务 器 和 对 象 ) 管理 和 分 配 上 的 基本 
问题 ， 并 介绍 了 一 些 已 有 的 数学 模型 ， 这 些 模型 用 于 在 一 般 框 架 下 解决 上 述 问 题 。 另 
外 ， 本 章 提供 一 些 例 子 及 相应 的 论述 ， 介 绍 了 如 何 使 用 一 些 精确 算法 和 启发 式 方法 来 
求解 相关 的 模型 以 解决 这 些 问 题 。 针 对 各 种 尚未 深入 研究 的 情况 ， 本 章 也 提供 了 一 些 
新 的 数学 模型 ， 如 设计 一 个 具有 较 高 生存 力 的 CDN。 

数学 模型 是 一 个 强大 的 工具 ， 可 以 解决 CDN 提供 商 面临 的 问题 ， 并 可 以 对 问题 
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的 本 质 获 得 更 深入 的 理解 。 正 如 在 前 面 提 到 的 ， 数 学 模型 可 以 提供 一 个 一 般 性 框架 ， 
通过 在 这 个 框架 上 设计 高 效 的 精确 算法 来 方便 了 问题 的 求解 。 对 于 精确 算法 而 言 ， 那 
些 基于 分 解 的 算法 最 有 可 能 成 功 地 求解 CDN 问题 。 在 评估 启发 式 方法 的 质量 时 ， 精 
确 算法 也 是 至 关 重 要 的 ， 特 别 是 评估 广泛 用 于 很 多 CDN 问题 中 的 贪 焚 启 发 式 方法 。 


本 章 中 的 一 些 资料 来 自 Computers & Operations Research Journal Z5; 5?! , 


样 例 问题 的 距离 矩阵 ( 可 解释 为 两 个 节点 ie7 和 jeJ 之 间 的 跳 数 ) 如 表 9. 4。 
RIA 样 例 问题 的 距离 矩阵 





cy j=l j=2 j=3 
i=l 1 1 3 
i=2 5 4 1 
i=3 1 5 5 
i=4 1 4 5 
i=5 1 3 2 
i-6 5 5 1 
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第 10 章 全 球 覆 盖 路 由 的 性 能 和 可 用 性 效益 


Hariharan S. Rahul, Mangesh Kasbekar, Ramesh K. Sitaraman 和 Arthur W. Berger 
10.1 引言 


人 类 历史 经 历 了 很 多 转折 点 ， 在 这 些 转 折 点 处 技术 革新 以 不 可 逆转 的 方式 从 根本 
上 改变 了 人 类 生活 的 各 个 方面 。 毫 无 疑问 ,现在 我 们 又 面临 着 一 个 新 的 转折 点 : 互联 
网 革命 。 然 而 ， 互 联网 要 想 成 为 下 一 个 革命 性 的 全 球 通 信 媒 介 ， 就 必须 解决 五 个 技术 
挑战 : 极 高 的 可 用 性 、 高 性 能 、“ 无 限 ” 的 可 扩展 性 、 完 善 的 安全 性 以 及 可 承受 的 
成 本 。 

互联 网 最 初 的 设计 目标 并 不 是 作为 一 个 具有 高 可 用 性 的 通信 媒介 ， 所 以 它 目 前 没 
有 提供 多 少 我 们 所 需要 的 东西 也 就 不 足 为 奇 。 因 此 ， 需 要 一 些 大 的 科技 创新 将 互联 网 
的 潜力 转变 成 实际 的 好 处 。CDN 覆盖 在 传统 互联 网 之 上 ， 作 为 实现 上 述 目标 的 一 项 
新 技术 ， 已 显示 出 巨大 的 前 景 。 


10.1.1 CDN 架构 回顾 


为 了 方便 读者 理解 本 章 的 内 容 ， 首 先 简要 回顾 一 下 商用 CDN 的 体系 架构 及 其 发 
展演 变 过 程 ， 更 详尽 的 内 容 可 参见 第 1 章 。 

CDN 出 现 之 前 ， 内 容 提 供 商 的 典型 做 法 是 在 一 一 个 数据 中 心 配置 个 中 央 服务 器 
集群 和 若干 个 流 服务 器 ， 向 全 球 的 终端 用 户 (也 称 为 客户 端 提供 内 容 服 务 。 然 而 ， 
这 种 方案 在 可 用 性 、 人 性 能 以 及 扩展 性 方面 存在 严重 的 不 足 。 内 容 从 源 服 务 器 进 和 互联 
网 时 会 存在 所 谓 的 “第 一 公里 ”瓶颈 问题 ， 而 当 内 容 跨 越 多 个 远 距 离 网 络 和 对 等 点 
时 又 会 遇 到 “中 间 公 里 ”瓶颈 (middle - mile bottleneck) 问题 。 在 “第 一 公里 ”内 ， 
数据 中 心 本 身 就 是 一 个 单 点 失效 。 在 数据 中 心 处 发 生 的 任何 一 个 连接 性 问题 (如 一 
个 超 负载 或 出 问题 的 交换 机 ) ， 都 会 导致 可 用 性 的 降低 甚至 彻底 瘫痪 。 而 在 中 间 公 里 
处 ， 当 内 容 远 距 离 传输 时 经 过 潜在 拥堵 的 对 等 点 时 ， 往 返 延 时 和 损耗 的 上 升 会 使 可 用 
性 和 性 能 大 大 降低 。 另 外 ， 对 于 瞬时 拥塞 问题 也 没有 防御 机 制 ， 除 非 数 据 中 心 一 开始 
就 获得 足够 高 的 配置 。 

对 托管 内 容 的 数据 中 心 采用 多 宿 ( multihoming) 技术 可 以 缓解 传统 托管 方式 的 一 
些 缺 陷 B] 。 也 就 是 说 ， 数 据 中 心 通过 多 条 链 路 与 多 个 网 络 提供 商 连 接 ， 并 使 用 一 定 的 
路 由 策略 来 控制 不 同 链 路 上 的 流量 。 另 一 个 互补 方案 也 可 以 缓解 集中 托管 面临 的 问 
题 ， 即 在 位 于 不 同 地 域 和 网 络 的 多 个 数据 中 心 内 ， 保 留 同 一 份 内 容 的 镜像 。 上 述 两 种 
方法 可 以 改善 第 一 公里 处 的 一 些 可 用 性 问题 ， 缓 解 因 单一 数据 中 心 或 网 络 的 失效 导致 
的 整个 网 站 的 瘫痪 ， 但 中 间 公 里 处 的 性 能 下 降 和 可 扩展 性 问题 仍 有 待 解决 。 另外， 由 
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于 要 有 效 地 管理 多 条 链 路 和 多 个 数据 中 心 ， 运 营 成 本 和 复杂 度 也 会 增加 。 不 仅 如 此 ， 
因为 在 发 生 故障 时 部 分 链 路 和 数据 中 心 必 须 能 够 承担 整个 系统 的 负载 ， 所 以 网 络 和 服 
务 器 资源 往往 需要 过 度 地 配置 。 对 可 用 性 和 性 能 的 更 高 要 求 就 需要 配置 更 大 的 服务 器 
集群 和 更 多 的 镜像 ， 这 意味 着 更 高 昂 的 设施 建设 成 本 。 因 此 ， 具 有 庞大 共享 的 分 布 式 
平台 的 CDN 就 显示 出 其 吸引 力 。 

从 上 1 章 的 讨论 中 可 知 ，CDN 是 一 种 服务 器 的 分 布 式 网 络 ， 它 履 盖 在 互联 网 之 
上 ， 以 高 性 能 、 高 可 靠 性 、 高 扩展 性 和 低 成 本 的 方式 向 客户 端 提供 内 容 。 一 个 高 度 简 
化 的 CDN 架构 包括 五 个 主要 部 分 ， 如 图 10. 1 所 示 。 

















图 10.1 一 个 CDN 的 高 级 架构 


1. 边缘 系统 

该 系统 包括 网 络 、 流 或 边缘 服务 器 ， 边 缘 服务 器 位 于 离 客户 端 很 近 的 互联 网 
“边缘 ”地 带 。 一 个 大 规模 的 CDN 拥有 数 万 个 服务 器 ， 分 布 于 全 球 所 有 主要 区 域 的 几 
干 个 网 络 (ISP) 。 边 缘 系 统 从 源 系 统 下 载 内 容 〈 见 图 10. 1 的 箭头 1) ， 将 相关 内 容 绥 
存 起 来 ， 并 最 终 分 发 至 客户 端 。 在 更 复杂 的 边缘 系统 中 ， 还 会 执行 一 些 应 用 ， 在 网 络 
边缘 处 动态 地 生成 内 容 ， 再 将 其 发 往 客户 端 。 

2. 监控 系统 

该 系统 实时 监控 互联 网 各 处 的 “天 气 ” 情 况 和 CDN 所 有 部 分 (包括 边缘 服务 
ar) 的 “健康 ”状况 。 在 图 10. 1 中 , 来 自 互联 网 的 输入 名 中 ， 既 可 能 包括 缓慢 变化 
的 信息 * (如 来 自 成 千 上 万 个 网 络 的 BGP 反馈 ) ， 也 有 可 能 是 快速 变化 的 性 能 信息 (使 
用 traceroute 和 ping 命令 在 互联 网 的 成 二 上 万 个 节点 之 间 采 集 )。 输 入 @ 包 含 边缘 服务 
右 、 路 由 器 及 其 他 系统 组 成 部 分 的 详细 信息 ， 这 些 信息 包括 它们 的 活跃 度 、 负 载 和 资 
源 使 用 状况 。 

3. 映射 系统 

映射 系统 的 职能 是 将 客户 端 定向 到 “最 优 ” 的 边缘 服务 器 ， 以 下 载 所 请 求 的 内 
容 (箭头 @)。 映 射 采用 的 常见 机 制 是 域名 解析 系统 (DNS， 箭头 @)。 在 典型 情况 
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下 ， 根 据 一 个 内 容 提 供 商 的 域名 www. cp. com, $$ E CDN 的 域 上 生成 别名 ( B 
CNAME’ d), ， 如 www. cp. com. cdn. net, CDN 托管 域 的 一 个 客户 端的 域名 服务 器 可 以 - 
查询 目标 服务 器 的 名 称 ， 据 此 得 到 其 IP 地址" 。 映 射 必须 保证 将 每 个 客户 端的 请 求 
转发 到 一 个 最 优 的 目标 服务 器 ， 该 目标 服务 器 具有 如 下 特性 : @ 目 标 服务 器 处 于 活路 
状态 ， 可 能 拥有 被 请 求 的 内 容 且 能 提供 内 容 服务 ; @ 目 标 服务 器 没有 过 载 ， 其 中 考察 
负载 的 指标 主要 包括 CPU、 内 存 、 磁 盘 和 网 络 的 利用 情况 ，@ 目 标 服务 器 和 客户 端 之 间 
的 连接 通畅 ， 即 没有 或 几乎 没有 丢 包 现象 ， 往 返 延 时 也 较 小 。 为 了 做 出 正确 的 决策 ， 映 
射 系统 把 来 自 监控 系统 的 网 络 动态 和 边缘 服务 器 的 状态 (输入 @) 以 及 对 互联 网 中 各 
个 域名 服务 器 的 流量 估计 作为 输入 信息 ， 通 过 复杂 的 优化 计算 得 出 合理 的 映射 方案 。 

4. 传输 系统 

该 系统 负责 在 互联 网 上 远程 传输 数据 。 被 传输 内 容 的 类 型 存在 差异 ， 对 服务 质量 
的 要 求 也 各 不 相同 ， 这 就 使 传输 系统 的 设计 极 具 挑战 性 。 例 如 ， 与 传输 动态 网 页 内 容 
FALE, AUR ( 即 编 码 器 ) 服务 器 传输 实时 流 媒 体内 容 到 边缘 服务 器 就 会 有 各 种 不 同 
的 需求 。 传 输 系统 面临 的 挑战 是 设计 一 套 小 巧 、 易 维护 的 通用 机 制 和 抽象 模型 ， 以 满 
足 多 样 化 的 需求 。 

5. 源 系 统 

该 系统 是 内 容 的 源头 ， 将 内 容 提供 给 全 球 的 客户 端 使 用 。 一 个 庞大 的 CDN 可 能 
有 几 万 个 源 系 统 (每 个 内 容 提供 商 有 一 个 或 多 个 ) ， 它 们 和 CDN 的 其 余部 分 发 生 交 
H Web 源 系 统 可 以 包括 应 用 程序 、 数 据 库 和 Web 服务 器 ， 提 供 流 媒 体 服务 的 设施 
可 以 是 存储 点 播 内 容 〈 即 预先 制作 的 内 容 ) 并 带 容错 机 制 的 大 型 服务 器 ， 也 可 以 是 
对 实时 内 容 进行 视频 采集 、 编 码 的 设备 。 这 些 设施 通常 (但 不 完全 是 ) 由 内 容 提供 
商 管理 ， 一 般 不 包括 数据 中 心 。 源 系统 还 包括 由 CDN 管理 的 入口， 它 是 内 容 提供 商 
的 “命令 中 心 ”"”， 用 于 提供 和 控制 内 容 提 供 商 的 内 容 (箭头 @@ 和 箭头 @) 。 


10. 1.2 传输 系统 


本 节 回 顾 几 种 不 同类 型 的 传输 系统 以 及 提高 性 能 的 优化 方法 ， 不 同类 型 的 传输 系统 可 
以 根据 被 传输 内 容 的 端 对 端 需求 来 区 分 。 下 面 回顾 一 下 传输 系统 采用 的 一 些 优化 方法 。 

1. 实时 流 

实时 流传 输 系 统 将 实时 媒体 内 容 从 流 的 源 端 (编码 器 ) 发 送 到 终端 用 户 ， 其 目 
标 是 优化 终端 用 户 对 于 流 数据 的 体验 ( 见 图 10.2) 。 编 码 器 对 实时 流 进行 编码 ， 并 在 
实时 流 的 持续 过 程 中 ， 将 编码 后 的 数据 包 按 正 确 的 顺序 发 送出 去 。 这 些 数据 流 首先 从 
编码 器 发 到 一 个 称 为 人 口 点 的 服务 器 集群 。 非 常 重要 的 一 点 是 ， 编 码 器 到 人 口 点 之 间 
的 网 络 延 时 要 很 低 甚至 没有 (或 几乎 没有 ) 丢 包 现象 。 编 码 器 和 人 口 点 的 连接 一 直 
处 于 监控 中 ， 如 果 连 接 出 现 问题 或 人 口 点 由 于 某 种 原因 失效 ， 传 输 系统 都 会 自动 地 将 
流转 向 另外 一 个 运行 良好 的 人 口 点 。 流 数据 从 人 口 点 再 被 发 送 给 一 到 多 个 称 为 反射 器 
的 服务 器 集群 。 每 个 反射 器 依次 将 数据 流 发 送 到 一 个 或 多 个 边缘 服务 器 集群 。 最 后 ， 
每 个 终端 用 户 通过 映射 系统 从 其 附近 的 一 个 边缘 服务 器 获取 实时 流 数据 。 

传输 系统 的 目标 ， 是 在 发 送 实时 流 的 过 程 中 保证 流 的 质量 并 最 小 化 流 数据 的 失 
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图 10.2 ”一 个 传送 实时 流 的 传输 系统 


真 。 终端 用 户 感受 到 的 数据 失真 包括 流 启动 之 前 的 长 延 时 、 信 息 丢 失 引 起 的 音频 / 视 
频 失真 以 及 回放 时 的 停顿 现象 。 通 过 人 和 人口 点 和 边缘 服务 器 之 间 的 反射 器 ， 每 个 流 都 自 
适应 地 选择 一 条 或 多 条 路 径 完成 传送 。 例 如 ， 从 入口 点 S 出 发 的 流 在 通过 反射 器 工 所 
在 路 径 传输 时 ， 它 的 一 个 完全 一 样 的 副本 也 会 同时 沿 着 反射 器 了 所 在 的 路 径 传 送 ， 最 
终 到 达 边缘 服务 器 D (DLE 10.2)。 如 果 一 个 数据 包 在 一 条 路 径 上 丢失 ， 而 它 的 副本 
通过 另 一 条 路 径 能 够 到 达 边 缘 服 务 器 ， 那 么 该 数据 包 仍 可 在 边缘 服务 器 得 到 恢复 。 而 
一 种 更 复杂 的 技术 是 ， 利 用 一 个 编码 方案 将 数据 包 编码 ， 然 后 将 编码 后 的 数据 流 发 送 
到 多 个 路 径 ， 这 样 即使 一 些 数据 包 在 传输 过 程 中 丢失 ， 在 边缘 服务 器 的 解码 过 程 中 这 
些 丢失 的 数据 包 仍然 可 以 恢复 。 

另 一 种 优化 的 例子 是 预 进发 (pre - bursting) ， 即 流 的 初始 部 分 在 发 送 给 终端 用 
户 时 ， 其 传输 速率 高 于 编码 码 率 ， 这 就 可 以 使 流 数 据 快速 填充 终端 用 户 媒 体 播放 器 的 
缓冲 区 ， 媒 体 播 放 器 得 以 快速 启动 流 ， 并 减少 回放 过 程 中 发 生 停顿 的 可 能 性 。 更 多 有 
关 流 传输 系统 算法 和 架构 设计 的 问题 可 参见 参考 文献 [6] 和 [12]. 

2. Web 与 在 线 应 用 

对 于 传输 系统 来 说 ， 它 实现 的 是 在 源 端 和 边缘 端 之 间 传 送 动态 生成 的 内 容 。 这 种 
内 容 包括 终端 用 户 下 载 的 动态 网 页 ， 以 及 上 传 到 网 站 的 由 用 户 生成 的 内 容 。 这 种 传输 
系统 的 一 个 目标 ， 是 优化 终端 用 户 执行 Web 事务 时 的 响应 速度 。 与 流 媒 体 一 样 ， 传 
输 系统 需要 用 到 一 个 或 更 多 个 中 间 节 点 ， 以 便 有 效 地 将 信息 从 源 端 传送 到 边缘 端 。 传 
输 系统 也 执行 一 些 与 应 用 有 关 的 优化 。 例 如 ， 一 个 传输 系统 为 了 加 速 动态 网 页 内 容 的 
传送 ， 会 从 源 端 预先 取出 网 页 中 的 内 嵌 内 容 传送 到 边缘 端 ， 以 降低 源 端 和 边缘 端 之 间 
的 通信 延 时 。 

与 应 用 有 关 的 一 个 传输 系统 ， 会 着 力 于 加 速 特定 ( 非 http) 的 应 用 技术 ， 如 
虚拟 专用 网 (VPN) 和 了 P 电 话 。 这 类 传输 系统 的 架构 设计 ， 与 为 Web 服务 的 传输 系 
统 相 比 在 性 质 上 有 很 大 不 同 ， 区 别 主要 在 于 终端 用 户 体验 所 具有 的 高 交互 和 实时 性 
特点 。 
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3. 覆盖 路 由 方案 

传输 系统 使 用 了 一 些 与 特定 应 用 有 关 的 增强 方法 来 应 对 端 到 端 需 求 。 例 如 ， 作 为 
一 个 节点 ， 传 输 系统 使 用 编码 方式 对 丢 包 进行 恢复 ， 使 用 预 进 发 来 加 速 流 的 启动 ， 使 
用 预 取 来 加 速 下 载 “”， 这 些 增强 方法 在 提升 传输 系统 整体 性 能 中 发 挥 了 重要 的 作 
用 。 所 有 传输 系统 的 一 个 基本 功能 ， 是 需要 在 内 容 的 发 送 点 ( 源 端 或 编码 器 等 ) 与 
向 终端 用 户 提供 服务 的 那个 点 (边缘 端 ) 之 间 寻 找 出 一 条 “和 较 好 的 路 径 ” 。 这 种 纯 网 
络 层面 的 功能 ， 是 通过 一 种 覆盖 路 由 方案 实现 的 ， 这 种 方案 的 实现 是 传输 系统 的 一 部 
分 功能 。 

一 个 通用 的 覆盖 路 由 方案 是 在 每 个 起 点 S (通常 是 源 端 ) 和 每 个 终点 D (通常 是 
边缘 服务 器 ) 之 间 ， 计 算 一 条 或 多 条 具有 高 可 用 性 和 低 延 时 的 “覆盖 路 径 ” 。 履 盖 路 
由 方案 一 般 使 用 互联 网 的 测量 数据 ， 对 几 百 万 个 源 一 目标 对 计算 它们 之 间 的 覆盖 路 
径 。 通 常情 况 下 ， 由 BCP 确定 的 从 源 S 到 目标 D 之 间 的 互联 网 路 径 (也 叫 直接 路 径 ) 
并 不 是 这 两 个 节点 之 间 的 最 优 路 径 。 这 并 不 奇怪 ， 因 为 选择 路 由 的 互联 网 协议 基于 的 
大 多 是 策略 而 非 性 能 。 一 条 从 S 出 发 ， 途 径 中 间 节 点 工 (通常 是 CDN 的 另 一 个 服务 器 
集群 ) ， 然 后 到 达 D 的 间接 路 径 很 可 能 更 快捷 或 (HL) 可 用 性 更 高 ! 覆盖 路 由 方案 
利用 了 这 一 现象 ， 选 择 最 优 的 覆盖 路 径 〈 直 接 或 间接 路 径 ) 来 转发 内 容 ， 从 而 增强 
了 端 到 端的 可 用 性 以 及 终端 用 户 的 性 能 体验 。 全 球 性 的 覆盖 路 由 方案 所 带 来 的 收益 是 
本 章 关 注 的 重点 。 


10.1.3 ”本章 的 贡献 


本 章 对 全 球 性 覆盖 路 由 方案 的 性 能 和 可 用 性 收益 进行 了 实验 评估 。 很 多 学 者 对 使 
用 覆盖 路 由 提升 互联 网 的 性 能 和 可 用 性 进行 了 研究 “"”。 不 过 ， 这 些 研究 工作 都 或 
多 或 少 地 存在 着 以 下 局 限 : 

1) 以 往 的 研究 大 多 基于 Internet2 的 平台 ， 该 平台 的 容量 、 使 用 模式 、 策 略 和 目 
标 都 与 商用 互联 网 存在 着 很 大 的 不 同 。 

2) 以 前 的 研究 中 用 到 的 覆盖 主要 是 针对 北美 。 然 而 众所周知 的 是 ， 亚 洲 和 欧洲 
在 网 络 的 互联 性 和 关系 上 与 美国 大 陆 有 很 大 不 同 。 

本 章 给 出 了 路 由 覆盖 在 商用 互联 网 中 对 性 能 和 可 用 性 提升 的 第 一 个 实验 研究 结 
果 。 本 章 使 用 Akamai CDN 的 一 个 全 球 子 集 来 收集 数据 。 具 体 地 说 ， 本 章 从 1100 个 地 
域 收集 测量 数据 ， 这 些 地 域 分 布 于 众多 不 同 种 类 的 ISP， 来 自 6 个 大 洲 ，77 个 国家 ， 
630 个 城市 。 本 章 解决 的 问题 是 在 位 于 互联 网 核心 地 带 的 源 服务 器 和 位 于 终端 用 户 附 
近 的 边缘 服务 器 之 间 寻 找到 一 条 最 佳 覆盖 路 径 ， 其 中 既 考 虑 了 以 往返 延 时 为 度量 的 性 
能 ， 也 考虑 了 路 径 的 可 用 性 ， 而 那些 以 吞吐 量 为 性 能 指标 的 应 用 (如 大 尺寸 文件 的 
FR) 则 不 在 本 章 的 研究 范围 之 内 。 


日 ”必要 时 ， 一 个 间接 路 径 的 中 间 节 点 可 能 多 于 一 个 。 原 书 注 
O inteme 是 一 个 高 级 组 网 协会 ， 由 美国 几 家 主要 的 研究 和 教育 机 构 组 成 。 Intemet@) 管 理 的 IP 网 络 
可 以 用 于 研究 目的 。 一 一 原 书 注 
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本 章 的 主要 贡献 为 : 

1) 第 一 次 采用 商用 互联 网 数据 对 覆盖 路 由 进行 评估 。 本 章 对 一 些 当 前 使 用 的 测 
试 平台 (如 PlanetLab! 31 RONU"). 提供 了 有 价值 的 交叉 验证 ， 并 指出 : 虽然 这 些 平 
台 为 北美 的 商用 互联 网 提供 了 性 质 上 相似 的 数据 ,但 它们 并 没有 反映 出 网 络 拓扑 
(特别 是 在 亚洲 ) 的 全 球 差异 性 。 

2) 分 析 结 果 显 示 ， 通 过 随机 选择 较 少 数量 的 宛 余 路 径 (欧美 3 条 , WIS A), 
可 以 使 可 用 性 接近 最 优 。 另 外 , 证 明了 在 合理 的 采样 间隔 (如 10min) MIR (2 条 
路 径 ) 下 ， 除 亚洲 外 有 超过 90% 的 源 一 目标 对 在 延 时 指标 上 获得 了 改善 ,与 理想 值 
的 差距 缩小 到 1096 以 内 。 而 对 于 源 节 点 或 目标 节点 在 亚洲 的 路 径 ， 则 需要 3 条 元 余 
路 径 才 能 达到 相同 的 性 能 。 

3) 本 章 提供 的 充足 证 据 表 明 ， 覆 盖 路 径 的 选择 可 以 在 很 长 的 时 段 内 〈 几 个 小 
时 ) 保持 固定 不 变 ， 这 说 明 对 于 几乎 所 有 的 源 一 目标 对 ， 网 络 信息 测量 的 频 度 即使 
相对 不 太 频 繁 也 可 以 提供 最 好 的 性 能 。 


10.1.4 内 容 安 排 


本 章 的 余下 部 分 组 织 如 下 : 10. 2 节 对 相关 工作 进行 回顾 ， 并 介绍 本 章 的 研究 背 
景 ; 10. 3 节 描 述 本 章 的 测试 平台 及 如 何 收集 测量 数据 ; 在 10.4 节 和 10.5 节 中 ， 给 出 
了 在 全 球 背 景 下 通过 路 径 覆 盖 可 以 获得 的 理想 性 能 和 可 用 性 提升 的 详细 度量 ; 10.6 
节 解 决 覆 盖 的 实用 设计 问题 探讨 了 覆盖 在 实用 中 的 性 能 和 可 用 性 的 结构 、 时 域 特 
TE; 在 10.7 和 10.8 市 中 给 出 了 未 来 的 研究 方向 及 展望 。 


10.2 相关 工作 


在 互联 网 的 性 能 和 可 用 性 的 度量 方面 ， 目 前 已 有 很 多 机 构 和 项 目 进 行 了 研究 ， 如 
CAIDA (Cooperative Association for Internet Data Analysis) 中 和 NIMI (National Internet 
Measurement Infrastructure) ^ , 来自 学术 机 构 的 路 由 覆盖 网 包括 MIT 的 RON ( Re- 
silient Overlay Network) 项 目 Oo 以 及 华盛顿 大 学 的 Detour Ji EH, Akamai 公司 提供 
的 商用 分 发 服务 将 覆盖 路 由 应 用 于 实时 流 、 动 态 网 络 内 容 和 应 用 加 速 ”… 。 

Andersen 等 人 号 给 出 了 一 个 称 为 RON 覆盖 路 由 的 实现 和 性 能 分 析 。 他 们 发 现 ， 
其 方法 可 以 使 延 时 性 能 提升 51% ， 与 本 章 在 北美 环境 下 获得 的 6396 的 改善 效果 相当 。 
Akella 等 人 王将 一 个 更 简单 的 路 由 控制 多 路 寻 址 方案 与 覆盖 路 由 方案 进行 了 比较 。 虽 
然 其 研究 的 着 眼 点 与 本 文 不 同 ， 但 它 提 供 了 一 个 单 路 寻 址 站 点 在 默认 情况 下 的 结果 ， 
发 现 如 果 用 往返 延 时 来 衡量 ,覆盖 路 由 可 以 使 性 能 平均 提高 23% 。 他 们 的 实验 基于 
美国 17 个 城市 的 68 个 节点 ， 这 个 实验 环境 与 本 章 中 的 北美 110 个 节点 相当 ， 而 本 章 
中 的 方法 可 以 将 整体 延 时 性 能 提升 约 21% 。 然 而 ， 人 性 能 的 提升 在 其 他 大 陆 之 间 有 显 
著 不 同 。Savage 等 人 ”使 用 了 20 ~ 40 个 节点 的 数据 ， 发 现 大 约 10% 的 源 一 目标 对 的 
最 佳 覆 盖 路 径 的 延 时 较 直 接 路 径 低 50% 。 而 在 本 章 的 北美 节点 实验 中 ， 虽然 对 于 其 
他 大 陆 的 节点 对 而 言 结果 也 会 有 很 大 的 不 同 ， 但 就 北美 节点 来 说 这 个 源 一 目标 对 的 比 
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BIA 9% ， 在 数值 上 也 与 他 们 的 结果 基本 相当 。 与 本 章 的 评估 相似 ，Gummadi 4& A 09 
在 PlanetLab 平台 上 实现 了 随机 单 跳 源 路 由 ， 其 结果 表明 使 用 至 多 4 个 随机 选择 的 中 
间 节 点 ， 就 可 以 提升 互联 网 路 径 的 可 靠 性 。 


10.3 实验 环境 的 配置 


本 节 介 绍 采 和 集 数据 时 的 实验 环境 配置 可 用 于 优化 边缘 网 络 (终端 用 户 处 ) 和 
企业 源 服务 器 之 间 的 互联 网 路 径 。 终 端 用 户 通 常 位 于 小 型 、 较 低层 的 网 络 中 ， 而 企业 
源 服 务 器 通常 位 于 一 级 网 络 。 本 节 在 研究 路 由 覆盖 问题 时 ， 涉 及 的 节点 只 包括 部 署 在 
大 型 、 一 级 网 络 中 的 节点 ， 这 些 节 点 在 从 源 (企业 源 服务 器 ) 到 目标 (边缘 服务 器 ) 
的 间接 路 径 中 ， 起 到 了 中 转 节点 的 作用 。 


10.3.1 测量 平台 


Akamai 的 CDN 服务 器 部 署 于 几 千 个 地 域 和 网 络 的 服务 器 集群 中 。 这 些 集群 大 部 
分 位 于 互联 网 边缘 附近 ， 即 靠近 终端 用 户 的 非 一 级 ISP 网 络 中 。 小 部 分 集群 部 署 在 直 
接 位 于 一 级 提供 商 处 的 核心 ISP 附近 ， 即 那些 适合 企业 源 服务 器 部 署 的 位 置 。 基 于 地 
理 和 网 络 位 置 的 多 样 性 以 及 安全 性 等 其 他 考虑 ， 本 节 实 验 从 整个 CDN 中 选择 了 1100 
个 集群 ， 这 些 集群 分 布 于 6 个 大 洲 77 个 国家 的 630 座 城市 。 每 个 集群 中 的 服务 器 与 
单个 内 容 提供 商 连接 。 大 约 15% 的 集群 位 于 核心 地 带 ， 其 余 则 分 布 在 网 络 边缘 ， 而 
间接 路 径 中 的 中 间 节 点 位 于 接近 核心 的 集群 。 表 10. 1 显示 了 所 选 节点 的 地 理 分 布 。 
实验 中 ， 所 有 的 数据 采集 活动 都 与 CDN 正常 的 数据 收集 活动 完全 隔离 。 


表 10.1 实验 平台 中 节点 的 地 理 分 布 


























大 洲 ( 助 记 符 ) 边缘 集 核心 集 
非洲 (AF) 6 0 
亚洲 (AS) 124 E 11 
中 美洲 (CA) | 13 0 
欧洲 (EU) | 154 30 
北美 洲 (NA) 624 110 
KEW (OC) 33 0 
南美 洲 (SA) 38 0 


10.3.2 性 能 和 可 用 性 数据 的 收集 


在 1100 个 集群 中 的 每 个 集群 上 运行 一 个 任务 ， 该 任务 每 隔 2min 向 核心 集中 的 每 
个 节点 发 送 一 个 大 小 为 64B 的 ICMP 回 显 请 求 ( ping) ， 这 样 一 个 核心 节点 处 的 请 求 
速率 保持 在 小 于 10 个 /s， 每 个 任务 持续 1. 5h。 如 果 发 生 丢 包 ， 即 10s 内 无 响应 ， 则 
上 报 一 个 特殊 值 作 为 往返 延 时 。 所 有 的 集群 每 天 运行 三 次 该 任务 ， 运 行 时 间 选 在 东 
亚 、 欧 洲 和 北美 东海 岸 的 网 络 流量 高 峰 时 。 实 验 从 2004 4E 10 月 18 日 开始 ， 一 共 运 
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行 了 4 周 。 这 样 ， 在 实验 中 每 条 路 径 被 探测 了 3780 次 ， 而 总 探测 次 数 大 约 为 65200 
万 次 。 由 于 网 络 维护 或 设施 变动 等 原因 ， 核 心 集 的 一 小 部 分 节点 在 某 个 时 段 不 可 用 ， 
这 时 需要 对 数据 进行 过 滤 并 清除 涉及 这 些 节点 的 所 有 数据 。 使 用 标准 全 节点 对 
(all - pairs) 最 短路 径 算法 "的 一 个 修正 版 本 对 数据 集 进行 分 析 ， 以 确定 包含 1 个 、2 
个 及 3 个 中 间 节 点 (来 自 核心 集 ) 的 最 短路 径 。 经 过 处 理 ， 可 以 得 到 一 个 7 元 组 的 集 
4, 该 7 元 组 的 形式 为 < 时 间 稚 ， 起 点 号 , 终点 号 ， 直 接 往 返 时 间 ， 单 跳 最 短 往返 时 
间 ，2 - 跳 最 短 往返 时 间 ，3 - 跳 最 短 往返 时 间 > 。 根 据 起 点 和 终点 所 在 的 大 洲 ， 这 个 
7 元 组 可 分 成 若干 类 。 

如 果 连 续 3 个 或 更 多 个 ping 操作 没有 回应 ， 则 认为 一 条 路 径 已 经 不 可 用 。Akella 
等 人 中 使 用 了 相同 的 配置 ， 而 ping 命令 发 送 的 间隔 为 1min。 假 设 丢 包 之 间 相 互 独立 ， 
且 2min 间隔 内 丢 包 概率 的 数量 级 为 1% ， 那 么 由 于 随机 拥堵 造成 的 连续 三 个 ping 命 
令 丢 失 的 概率 为 10 的 数量 级 。 路 径 不 可 用 的 时 段 从 发 送 第 一 个 被 丢失 的 ping 命令 
开始 算 起 ， 至 最 后 一 个 连续 丢失 的 ping 命令 的 发 送 时 间 为 止 。 这 看 上 去 是 个 保守 的 
估计 ， 意 味 着 所 做 结论 只 能 针对 超过 6min 的 互联 网 路 径 失 效 。 

在 可 用 性 分 析 时 过 滤 掉 了 一 些 区 域内 边缘 节点 的 测量 数据 ， 因 为 其 测量 数据 的 失 
效 特性 与 其 他 的 互联 网 路 径 相 比 具 有 非常 明显 的 差异 。 


10. 3.3 评估 


本 章 对 结果 进行 了 汇总 ， 汇 总 工作 基于 源 节点 和 目标 节点 所 在 的 大 洲 ， 这 人 么 做 的 
原因 是 ， 企 业 网 站 的 经 营 策略 一 般 是 针对 来 自 他 们 所 在 大 陆 的 用 户 。 这 些 洲际 路 径 的 
分 类 可 以 用 一 个 助 记 符 来 表示 ,如 AS - NA ( 见 表 10.1) 表示 边缘 服务 器 位 于 亚洲 、 
源 服务 器 在 北美 。 


10.4 ”覆盖 路 由 对 性 能 的 改善 


本 节 评 估 和 覆盖 路 由 在 理想 情况 下 的 性 能 提升 。 对 于 每 个 源 一 目标 对 ， 两 者 之 间 所 
有 可 能 的 间接 路 径 都 予以 考虑 ， 并 实时 计算 出 最 佳 间接 路 径 。 本 节 使 用 延 时 作为 性 能 
的 测量 标准 ， 即 从 源 节 点 到 目标 节点 的 往返 时 间 (简写 为 RTT)。 

对 于 每 个 源 一 目标 对 ， 本 节 比 较 了 直接 路 径 和 最 快 间接 路 径 ， 结 果 在 表 10. 2 中 
给 出 。 根 据 路 径 类 别 和 最 快 间接 路 径 较 直接 路 径 的 延 时 所 提升 的 百分比 ， 将 数据 集 分 
成 几 组 。 表 10.2 显示 了 每 组 数据 中 源 一 目标 对 的 所 占 比例 ， 表 中 的 每 行 之 和 为 
100% 。 例 如 ， 对 于 表 中 AS - AS 那 一 行 ,“ < -10%” 那 一 组 表示 最 快 间接 路 径 比 直 
接 路 径 慢 至 少 10% ， 且 所 有 AS - AS 路 径 中 属于 该 组 的 占 15.5%. “+10%” WHAK 
示 ， 最 快 间 接 路 径 和 直接 路 径 性 能 相近 ， 二 者 之 间 的 延 时 差异 在 10% 以 内 ， 且 所 有 
AS - AS 路 径 中 属于 该 组 的 占 24.7% 。 在 剩 下 的 直接 路 径 中 ， 有 23. 4% 获得 了 较 小 提 
Ft (10% ~30% ) ， 有 13.2% 提升 明显 (30% ~50%), ， 另 有 23. 2% 的 路 径 获 得 了 很 
大 的 改善 ， 采 用 间接 路 径 可 以 使 延 时 性 能 提升 一 半 以 上 。 
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表 10.2 延 时 下 降 的 比例 








分 类 < -10% +10% 10% ~30% 30% ~50% >50% 

( 较 小 ) (相当 ) ( 较 大 ) (显著 ) (很 大 ) 
AF - AS 4.0 44. 5 44.2 5.7 1.6 
AF - EU 0.6 69.3 18.1 9.7 2.3 
AF -NA 0.0 74.2 21.6 | 3.5 0.6 
AS - AS 15.5 24.7 23.4 13.2 23.2 
AS - EU 0.9 33.9 45. 5 12. 5 7.2 
AS -NA 0.1 43.2 42.4 7.6 6.7 
CA - AS 0.0 40. 5 53.5 4.6 1.4 
CA - EU 1.4 53.2 42.3 2.5 0.7 
CA - NÀ 1.7 44.1 41.3 11.2 1.8 
EU - AS 0.6 24.5 63.8 7.8 3.2 
EU - EU 10. 5 36.4 30. 5 12. 6 10.0 
EU -NA 0.0 50.6 45.1 3.3 0.9 
NA -AS 0.0 34.0 37.9 5.4 2.6 
NA - EU 0.1 43.1 51.1 4.4 1.4 
NA -NA 2.4 34.7 39.0 15.0 9.0 
OC - AS 6.1 38.9 18.9 22.9 13.2 
OC - EU 0.0 60.4 35.1 3.9 0.7 
OC -NA 0.0 66. 7 25.6 6.3 1.4 
SA - AS 0.1 43.1 47.9 5.5 3.4 
SA - EU 0.4 66. 1 28.9 2.3 2.2 
SA -NA 0.9 55.1 35.1 Ov 3.3 





从 整体 上 看 ， 按 分 类 计算 有 大 约 4% ~35% 的 源 一 目标 对 的 延 时 指标 提升 了 30% 
以 上 。 另 外 ，AS - AS 和 EU - EU 两 类 中 大 量 源 一 目标 对 的 性 能 提升 超过 了 50% ， 这 
表明 在 这 些 洲 的 ISP 之 间 存 在 着 大 量 的 病态 路 由 。AS - AS 路 径 中 有 很 多 都 经 过 加 利 
福 尼 亚 的 对 等 位 置 ， 如 台北 的 超 媒体 和 上 海 的 中 国电 信之 间 的 路 径 。 采 集 到 的 路 由 信 
息 显 示 ， 所 有 从 台北 超 媒体 至 亚洲 其 他 地 方 的 路 由 都 途经 加 利 福 尼 亚 ， 一 个 例外 是 台 
北 超 媒体 至 上 海 的 中 国电 信 ， 它 是 直接 从 台北 连 到 了 上 海 。 因 此 ， 台 北 至 上 海 的 路 径 
几乎 得 不 到 提升 ， 因 为 相 比 直 连 而 言 所 有 的 其 他 替代 路 径 当 然 都 是 绕 远 的 。 与 此 同 
时 ， 台 北 的 超 媒 体 至 亚洲 其 余地 域 的 路 径 则 获得 了 很 大 的 性 能 提升 ， 因 为 它们 之 间 的 
直接 路 径 本 身 就 非常 绕 远 ， 不 过 其 中 倒是 存在 一 条 途径 上 海中 国电 信 的 路 径 ， 它 的 传 
输 速率 快 50% 以 上 。 

企业 很 希望 提高 其 网 站 在 最 坏 情况 下 的 性 能 ， 以 提高 用 户 的 访问 速度 。 所 以 ， 通 
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过 覆盖 路 由 对 上 述 各 类 中 的 最 长 路 径 延 时 进行 改善 就 特别 具有 吸引 力 。 从 一 个 给 定 的 
类 别 中 选择 一 个 “典型 的 ” 源 一 目标 对 和 一 个 连接 性 较 差 的 源 一 目标 对 ， 将 两 者 的 
延 时 降低 情况 进行 了 比较 。 按 照 直接 路 径 的 延 时 ， 将 每 类 数据 按 10ms 的 间隔 分 组 ， 
然后 提取 典型 的 源 一 目标 对 的 第 50 百 分 位 数 分 组 和 连接 较 差 的 源 一 目标 对 的 第 90 百 
分 位 数 分 组 。 使 用 这 些 分 组 的 数据 计算 最 快 间接 路 径 较 直接 路 径 的 平均 提升 。 表 
10.3 比较 了 每 类 中 典型 的 源 一 目标 对 和 连接 较 差 的 源 一 目标 对 之 间 的 性 能 提升 。 对 
于 典型 的 源 一 目标 对 ， 在 表 10.2 所 示 的 21 个 类 别 中 ， 只 有 AS - AS, OC - AS 和 
CA -NA 在 延 时 方面 的 提升 超过 了 20% 。 相 比 而 言 ， 对 于 连接 较 差 的 源 一 目标 对 ， 有 
一 半 的 类 别 得 到 了 超过 20% 的 性 能 提升 ， 其 中 AS - AS、AS - NA 和 EU - EU 等 重要 的 
类 有 显著 的 改善 ， 而 与 此 形成 对 照 的 是 ， 对 于 源 自 非洲 的 源 一 目标 对 ， 第 90 百 分 位 
数 分 组 的 延 时 不 仅 很 高 ， 覆 盖 路 由 对 其 也 没有 产生 作用 。 对 于 AS - AS， 典 型 的 和 连 
接 较 差 的 源 一 目标 对 都 有 显著 改善 ， 而 前 者 的 提升 更 为 明显 。 不 管 怎 样 ， 大体 上 可 以 
得 到 这 一 结论 : 与 典型 的 源 一 目标 对 相 比 ， 连 接 较 差 的 源 一 目标 对 可 以 得 到 更 显著 的 
改善 。 

下 面 进行 更 深入 的 评估 ， 分 析 连 接 较 差 的 源 一 目标 对 中 较 大 提升 、 显 著 提 升 以 及 
很 大 提升 各 占 的 比例 。 从 一 个 给 定 类 别 中 ， 选 出 直接 路 径 延 时 超过 该 组 第 90 百 分 位 
数 的 那些 源 一 目标 对 ， 将 其 分 组 并 生成 连接 较 差 的 源 一 目标 对 的 延 时 降低 量 的 柱状 
图 ， 如 图 10. 3 所 示 。 在 该 图 中 ， 同 时 显示 了 该 类 中 所 有 源 一 目标 对 的 对 应 数值 〈 注 
意 : 在 该 图 中 ， 所 有 源 一 目标 对 的 数据 在 表 10.2 的 最 后 三 列 给 出 ) 。 在 连接 较 差 的 
源 一 目标 对 中 ， 超 过 80% 获得 了 较 大 及 较 大 以 上 的 性 能 提升 ， 而 67% 的 样本 则 有 显 
著 或 巨大 的 性 能 提升 。 有 些 类 别 与 上 述 结果 存在 着 偏差 ， 例 如 目标 在 非洲 的 连接 很 差 
的 源 一 目标 对 并 未 获得 大 的 性 能 提升 。 


表 10.3 典型 的 和 连接 较 差 的 源 一 目标 对 的 延 时 降低 情况 
第 50 百 分 位 数 第 90 百 分 位 数 
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第 50 百 分 位 数 第 90 百 分 位 数 
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连接 较 差 的 源 一 目标 对 
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图 10. 3 ”所 有 的 和 连接 较 差 的 源 一 目标 对 的 延 时 下 降 情况 


10.5 ”覆盖 路 由 对 可 用 性 的 提高 
在 本 节 中 ， 对 理想 情况 下 狠 盖 路 由 带 来 的 可 用 性 改善 进行 评估 。 在 评估 过 程 中 ， 
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每 个 源 一 目标 对 之 间 所 有 可 能 的 间接 路 径 都 将 予以 考虑 ， 只 要 一 条 间接 路 径 可 用 则 实 
时 选用 它 以 缓解 失效 。 

本 节 研 究 了 每 个 源 一 目标 对 之 间 直 接 路 径 的 失效 频 度 ， 以 及 在 直接 路 径 失 效 期 间 
每 条 间接 路 径 发 挥 替 代 作 用 的 时 间 占 比 ， 这 有 助 于 分 析 覆 盖 路 由 对 可 用 性 的 最 大 改善 
效果 。 图 10.4 显示 了 每 个 类 别 中 源 一 目标 对 之 间 的 直接 路 径 出 现 失效 的 比例 。 从 图 
中 可 以 发 现 ， 直 接 路 径 的 失效 比例 从 0.03% 到 0.83% 不 等 ， 其 中 亚洲 的 可 用 性 最 低 : 
在 失效 率 最 高 的 10 个 类 别 中 ， 有 9 个 存在 着 位 于 亚洲 的 端点 。 而 使 用 覆盖 路 由 后 ， 
大 多 数 类 别 的 失效 比例 下 降 了 0.3% ~0.5% ， 这 说 明 间 接 路 径 有 助 于 避免 直接 路 径 
的 失效 。 事 实证 明 ， 那 些 与 亚洲 有 关 的 高 失效 率 类 别 的 可 用 性 得 到 了 显著 提升 。 
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图 10.4 使 用 覆盖 路 由 后 失效 比例 的 下 降 


与 10. 4. 1 节 类 似 ， 本 节 研 究 覆 盖 路 由 如 何 提高 那些 直接 路 径 经 常 失 效 的 源 一 目 
标 对 的 可 用 性 。 同 样 ， 对 于 那些 有 意 借助 CDN 增强 其 终端 用 户 可 用 性 的 公司 来 说 ， 
这 也 是 它们 非常 关心 的 问题 。 众 所 周知 ， 互 联网 中 大 量 的 路 径 失效 都 是 发 生 在 一 小 部 
分 路 径 上 。 参 考 文献 [15] 的 研究 结果 显示 ， 互 联网 中 30% 的 失效 发 生 在 3% 的 路 
径 。 在 表 10. 4 所 示 数 据 中 也 可 以 发 现 类 似 的 情况 : 大 约 30% 的 失效 发 生 在 3% 的 直 
接 路 径 ， 而 10% 的 直接 路 径 “ 贡 献 ” 了 50% 的 失效 。 

数据 显示 ， 每 类 中 可 用 性 最 低 的 那些 源 一 目标 对 产生 的 失效 数 占 总 失效 数 的 
30% ， 因 此 本 节 对 这 些 源 一 目标 对 重新 进行 了 可 用 性 分 析 ， 结 果 如 表 10. 4 所 示 。 如 
果 一 个 源 一 目标 对 之 间 的 直接 路 径 失效 率 超过 20% ,证 明 在 这 条 直接 路 径 上 存在 某 
些 特 定 的 长 期 性 问题 ， 而 非 随机 、 了 瞬时 的 失效 或 短期 拥堵 。 几 乎 所 有 存在 长 期 可 用 性 
问题 的 源 一 目标 对 在 使 用 了 覆盖 路 由 后 ， 都 获得 了 很 满意 的 可 用 性 ! 改善 那些 可 用 性 
最 低 的 源 一 目标 对 ， 是 覆盖 路 由 的 一 个 关键 作用 。 


表 10.4 连接 性 较 差 路 径 的 可 用 性 数据 





A 30% 失效 率 的 无 覆盖 路 由 的 有 覆盖 路 由 的 
路 径 百 分 比 失效 率 百 分 比 失效 率 百分比 

AF - AS 4.5 25.8 0 

AF - EU 1.7 8.8 0 


AF-NA 0.6 36.2 0 








$103 “全球 履 盖 路 由 的 性 能 和 可 用 性 效益 211 


(X) 
- 30% 失 效率 的 无 覆盖 路 由 的 有 覆盖 路 由 的 
路 径 百 分 比 失效 率 百分比 失效 率 百分比 
AS - AS 2.7 31.4 0 
AS -EU l5 9.8 0 
AS - NA 0.4 30 0 
CA - AS 3.5 28. 2 0 
CA - EU 1.6 10. 9 0 
CA - NA 0.5 30.3 0 
EU - AS 3 30. 1 0 
EU - EU 0.9 10. 8 0 
EU - NA 0.4 30. 1 0 
NA - AS 2.7 32.3 0 
NA -EU 0.4 13.2 0 
NA-NA 0.2 40. 2 0 
OC - AS 3.1 30. 8 0 
OC - EU 1.4 10. 7 0 
OC - NA 0.4 29.3 0 
SA - AS 3.3 28.8 0 
SA - EU 2.2 9.5 0 
SA - NA 0.8 23 0 


10.6 在 实际 设计 中 获得 提升 


10. 4 节 和 10. 5 节 中 的 分 析 描述 了 理想 情况 下 的 特征 ， 即 使 用 网 络 测量 数据 实时 
计算 节点 之 间 的 间接 路 径 ， 且 假设 被 探测 出 来 并 用 做 间接 路 由 的 间接 路 径 的 数量 不 受 
限制 。 因 此 ， 上 述 对 覆盖 路 由 提升 性 能 和 可 用 性 的 分 析 是 一 个 基于 最 好 情形 下 的 估 
计 。 然 而 ， 在 实际 系统 中 ， 在 给 定时 刻 :得 到 的 测量 数据 需要 在 上 + r 时 刻 之 前 完成 覆 
盖 路 径 的 计算 ， 以 供 传输 系统 使 用 。 而 对 于 一 个 给 定 的 源 一 目标 对 ， 在 任意 给 定时 间 
内 构造 出 并 供 使 用 的 间接 路 径 的 数量 (路径 数目 x) 并 不 多 。 本 节 将 这 些 现实 因素 引 
人 到 分 析 中 ， 并 评估 其 对 结果 的 影响 。 当 « 增 大 且 7 减 小 时 ， 覆 盖 路 径 的 构建 成 本 会 
上 升 ， 但 同时 会 要 求 其 质量 也 有 所 提高 ， 并 接近 10.4 节 和 10.5 节 中 给 出 的 最 佳 
路 由 。 

首先 ,评估 一 个 简单 的 多 路 径 、 无 记忆 覆盖 路 由 方案 ,该 方 案 使 用 单纯 的 静态 信 
息 随机 选择 k 条 路径 中 的 部 分 路 径 ， 并 使 用 这 些 路 径 对 内 容 进 行路 由 。 这 种 覆盖 路 由 
方案 当然 有 可 能 比 理想 方案 要 差 一 些 ， 但 本 节 的 目标 是 提供 一 个 标本 来 验证 在 使 用 禾 
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盖 路 径 时 使 用 智能 和 自 适应 技术 的 重要 性 。 令 人 惊讶 的 是 ， 结 果 显 示 这 种 随机 选择 很 
成 功 ， 当 k =3 时 获得 了 接近 最 优 的 可 用 性 。 这 表明 ， 互 联网 提供 了 非常 好 的 路 径 多 
样 性 ， 一 般 来 说 ， 失 效率 也 较 低 。 然 而 ， 上 述 策略 在 性 能 的 提升 方面 却 显得 无 能 为 
力 。 这 表明 ， 若 想 提 高 性 能 ， 在 构造 覆盖 路 由 时 就 必须 要 仔细 选择 路 径 ， 这 就 是 本 节 
随后 部 分 的 关注 焦点 。 


10.6.1 最 优 路 径 的 稳定 性 


对 于 一 个 寻求 性 能 最 优 的 覆盖 路 由 方案 ， 在 选择 路 径 时 往往 会 偏离 最 优选 择 。 这 
是 因为 ， 各 条 路 径 上 的 延 时 会 随时 间 的 推移 而 发 生变 化 ， 从 而 使 最 优 路 径 发 生 了 变 
化 。 为 便于 分 析 ， 首 先 需要 了 解 源 一 目标 对 的 特点 。 所 有 的 源 一 目标 对 一 般 可 以 归于 
下 面 两 类 : 

1) 从 源 节 点 到 目标 节点 (以 下 分 别 简称 源 和 目标 ) 的 最 好 路 径 相 当 持 久 ， 无 论 
两 者 之 间 所 有 路 径 的 延 时 如 何 变化 ， 最 优 路 径 都 不 会 改变 。 

2) 随 着 时 间 的 推移 ， 路 径 的 延 时 变化 将 导致 源 和 目标 之 间 的 最 好 路 径 发 生 明 显 
的 变化 ， 反 过 来 又 会 引起 最 佳 路 径 的 变化 。 

第 一 类 中 的 源 一 目标 对 不 需要 非常 动态 的 覆盖 设计 来 选择 间接 路 径 。 例 如 ， 对 于 
由 新 加 坡 Pacific Internet 至 伦敦 AboveNet 的 那 条 路 径 ， 其 直接 路 径 从 新 加 坡 经 东京 、 
旧金山 、 达 拉 斯 和 华盛顿 特区 到 达 伦敦 ， 花 费时 间 大 约 340ms。 而 两 者 之 间 有 一 条 途 
经 某 个 中 间 节 点 的 间接 路 径 ， 该 中 间 节 点 位 于 伦敦 的 ISP Energis Communications。 新 
加 坡 Pacific Internet 与 该 中 间 节 点 之 间 只 有 一 跳 (可 能 是 卫星 链 路 ) ， 其 延 时 为 
196ms, ， 而 随后 从 该 中 间 节 点 到 伦敦 AboveNet 只 需 2ms。 因 此 间接 路 径 比 直接 路 径 快 
了 140ms 以 上 (〈 即 41.2% ) 。 即 使 延 时 发 生 了 变化 ， 但 最 优 路 径 几 乎 不 会 变化 。 

对 于 第 二 类 的 源 一 目标 对 ， 延 时 的 差异 则 非常 重要 。 通 过 计算 一 个 统计 量 (C 
名 为 Churn) ， 本 节 系 统 地 检验 了 路 径 间 延 时 的 变异 程度 。 该 统计 量 可 以 测量 最 好 的 « 
条 路 径 的 集合 在 两 个 不 同时 刻 的 差异 程度 。 对 于 给 定 的 节点 对 ， 在 每 个 时 刻 上 有 


Churn,(«,7) EI IS(k,t) —- S(k,t +7) |k 
AF, SCe, t) EE t 时刻 源 一 目标 对 之 间 所 有 节点 中 性 能 最 好 的 e 条 路 径 的 集合 。 
对 于 一 个 节点 对 来 说 ， 统 计量 Churn( x, 7) 是 对 1 的 所 有 有 效 值 计算 出 的 Chur, (x, 
7) 的 平均 值 。Churn(«, 7) 的 值 介 于 0 和 1 之 间 ， 为 0 时 意味 着 具有 一 组 持续 不 变 的 
最 好 路 径 ; 接近 1 时 则 表示 这 些 最 好 路 径 存在 着 快速 的 变化 。 研 究 发 现 ， 大 多 数 源 一 
目标 对 的 Churn(, 7) 都 超过 10% ， 即 使 选择 了 多 达 k = 5 条 最 好 路 径 及 预测 时 间 7 = 
2min 时 也 是 如 此 。 

为 了 更 细致 地 检验 路 径 扰 动 ， 可 以 定义 一 个 松弛 度量 RelaxChurn(k, +) ， 该 量 仅 
GBP m eS(k, t) -S(k, t+7T)， 这 些 路 径 在 1+7 时 刻 的 延 时 高 于 S(k, 1+7) 中 
延 时 指标 最 差 的 路 径 的 延 时 的 110% 。 也 就 是 说 ， 如 果 保 留 r 中 的 路 径 则 1+7 时 刻 的 
性 能 将 降低 10% 以 上 。 有 意思 的 是 ， 对 于 大 多 数 类 别 中 80% 以 上 的 源 一 目标 对 ，Re- 
laxChurn( x, 7) 平 均 而 言 都 小 于 10% 。 这 表明 ， 如 果 路 径 选 择 算法 能 够 基于 当前 的 测 
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量 值 对 未 来 做 出 预测 ， 则 可 以 接近 理想 的 性 能 。 


图 10.5 中 显示 了 在 k=1 和 7 =2min Bf, Churn(x, +) 和 RelaxChurn (K,T) 小 
T 1096 的 源 一 目标 对 的 百分比 。 从 图 中 可 以 发 现 ， 当 路 径 的 两 个 端点 都 在 亚洲 时 ， 
路 径 的 RelaxChurn 的 值 比 Churn 的 值 更 高 ， 但 只 有 63% 的 源 一 目标 对 存在 churn 值 较 
低 的 路 径 。 所 以 ， 对 于 AS - AS 路 径 ， 只 有 在 付出 更 高 的 网 络 测量 成 本 时 ， 性 能 才 有 


Bi 低 chur 值 的 路 径 百 分 比 ” 园 低 Relax churn 值 的 路 径 百分比 


可 能 提升 。 


图 10.5 7=2min 和 k=1 时 具有 低 Relaxchurn 值 和 低 Churn 值 的 源 一 目标 对 的 百分比 


10.6.2 预测 覆盖 路 由 的 性 能 提升 


在 10. 6. 1 节 的 分 析 中 ， 是 利用 纯 结 构 特 性 来 检验 稳定 性 。 在 本 节 ， 将 使 用 参数 
< 和 7 的 覆盖 路 由 与 一 直选 择 最 优 路 径 的 理想 情况 进行 性 能 的 比较 。 注 意 ， 因 为 给 定 


时 间 的 最 优 路 径 至 少 与 直接 路 径 一 样 快 ， 所 以 这 将 使 覆盖 处 于 一 个 较 高 的 标准 。 


表 10.5 与 最 优 延 时 的 差异 在 10 多 以 内 的 路 径 百分比 























路 径 所 占 百 分 比 
类 别 K=1 K=2 
EU - AS 88.4 
NA - AS 66.2 
NA - EU 81.3 
NA -NA | ee | 90 | 


一 个 需要 验证 的 常见 情形 是 当 k= 1 的 情况 ， 也 就 是 说 在 以 后 的 评估 中 只 选择 最 
优 路 径 。 表 10.5 中 的 第 2 列 和 第 3 列 显示 的 是 当 7 分 别 为 2min 和 7 = 10min 时 的 结 
果 。 以 类 别 NA - NA 为 例 ， 从 表 中 可 以 看 出 ， 当 r = 2min Bf, 71.6% 的 路 径 的 延 时 





K=3 
T=2 
89. 4 
94.5 
96.0 
92.8 
93.1 
96.2 
93.7 
97.2 
95.0 
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与 最 优 延 时 相差 10% 以 内 。 甚 至 当 r Kik 10min 时 ， 仍 有 69. 6% 的 路 径 取 得 了 相同 
的 结果 。 与 源 自 欧洲 的 路 径 相 比 ， 源 自 亚洲 的 路 径 又 一 次 大 大 偏离 了 最 优 值 ， 而 源 自 
北美 的 路 径 数 据 差 异 范围 最 大 。 

既然 当 x = 1 时 性 能 的 提升 在 各 地 都 不 明显 ， 那 么 就 赋予 x 更 高 的 值 。 以 NA - 
EU 为 例 ， 如 表 10.5 Prax, “4x =1 时 有 82.3% 的 路 径 和 最 优 值 相差 10% 以 内 ; 将 
增加 到 2 后 ， 相 差 10% 以 内 的 路 径 数 增加 了 大 约 13. 1% ; « 增加 到 3 时 ， 其 余 的 路 径 
只 获得 了 很 小 的 提升 ， 相 差 1096 以 内 的 路 径 数 只 进一步 增加 了 1.8%. k= 2 相对 于 
k =1 获得 的 边际 收益 并 不 成 比例 ， 而 x =3 时 获得 的 边际 收益 则 低 得 多 。 事 实 上 ， 除 
了 目标 点 在 亚洲 的 路 径 ， 当 k = 2 时 超过 90% 的 源 一 目标 对 与 理想 性 能 的 偏差 在 
10% 以 内 ， 甚 至 r 在 增加 时 该 事实 依然 存在 。 结 果 也 表明 ， 在 使 用 1 或 2 条 路 径 时 
(kz1, 2), ， 覆 盖 路 由 可 以 取得 满意 的 效果 。 例 如 ， 对 于 NA - EU 中 的 源 一 目标 对 ， 
M k= 2 时 有 95.4% 的 节点 对 与 最 优 值 相差 10% 以 内 。 通 过 与 前 面 k=1 时 的 结果 相 
比 可 知 ， 在 同样 的 条 件 下 既然 有 82.3% (k=1) 的 节点 对 只 需要 选择 1 条 路 径 ， 那 
么 可 想 而 知 一 个 覆盖 路 由 方案 使 用 两 条 路 径 时 可 能 只 是 为 了 满足 额外 的 那 13. 1% 的 
节点 对 ， 平 均 而 言 ， 每 个 节点 对 只 使 用 1. 09 条 路 径 。 

两 个 端点 都 在 亚洲 的 源 一 目标 对 表现 出 了 不 同 的 特点 。 例 如 ， 当 « 从 1 增 到 2 
时 ， 与 最 优 值 偏差 10% 以 内 的 源 一 目标 对 的 比例 从 62. 4496 ERFA] 84.57% (这 时 ， 
加 权 平 均 后 每 个 节点 对 使 用 的 路 径 数 为 1. 31)。 然 而 ， 这 一 比例 要 想 达 到 接近 90% 的 
话 ， 需 要 k 增加 到 3。 

表 10.5 显示 的 是 7= 2min 和 «= 2 时 的 结果 。 需 要 注意 的 是 ， 当 7 在 2 ~ 10min 
之 间 变 化 时 ， 这 些 数 值 仍然 保持 相对 稳定 (与 x = 1 时 类 似 ) 。 这 意味 着 ， 在 路 径 数 
量 很 大 时 ， 提 高 测量 频 度 不 会 带 来 延 时 性 能 的 提高 。 在 10. 6.3 节 中 将 进一步 研究 延 
时 性 能 对 7 的 敏感 性 。 | 

相对 理想 情况 而 言 ， 旨 在 提高 覆盖 路 由 性 能 的 设计 反而 降低 了 可 用 性 。 这 是 因 
为 ， 如 本 章 前 面 几 个 例子 所 示 ， 所 有 路 径 中 效果 较 好 的 那些 路 径 一 般 会 共享 一 小 部 分 
共用 链 路 ， 这 不 仅 会 导致 路 径 多 样 性 变 小 ， 而 且 当 这 些 共享 的 链 路 同时 失效 时 会 暴露 
出 更 大 的 脆弱 性 。 


10.6.3 稳定 性 


10.6. 2 节 的 分 析 表 明 ， 当 7 的 取 值 在 2 ~ 10min 之 间 时 ， 和 覆盖 路 由 带 来 的 性 能 提 
升 对 7 的 取 值 具有 轻微 的 敏感 性 。 在 本 节 ， 采 用 一 些 极 端的 例子 研究 基于 预测 的 覆盖 
路 由 的 时 间 敏 感性 。 在 每 天 内 每 隔 一 定时 间 (4 ~11h 不 等 ) 采样 一 个 1.5h 的 样本 ， 
在 该 样本 中 使 用 基于 测量 的 覆盖 路 由 ， 再 评估 下 一 个 1. 5h 样本 中 的 性 能 。 尽 管 在 两 
个 样本 之 间 的 时 段 内 覆盖 路 由 完全 有 可 能 是 次 优 的 ,但 结果 显示 即使 对 这 么 长 时 间 跨 
度 进行 预测 ，NA -NA 中 大 约 87% 和 AS - AS 中 大 约 74% 的 路 径 与 理想 情况 下 的 偏差 
仍 在 10% 以 内 。 数 据 结果 显示 ， 对 于 大 多 数 的 节点 对 而 言 ， 各 种 可 选 路 径 的 性 能 具 
有 高 度 的 一 致 性 。 相 反 ， 只 有 少量 路 径 在 短期 内 变化 较 大 ， 即 便 < 上 升 到 5 或 6， 使 
用 预测 机 制 的 覆盖 路 由 也 很 难 对 这 些 路 径 实现 优化 ” 。 
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10.7 未 来 研究 方向 


本 章 定量 地 研究 了 覆盖 路 由 对 性 能 和 可 用 性 的 改善 ， 以 及 这 种 改善 在 不 同 洲 之 间 
的 差异 。 互 联网 低 效 率 的 根源 在 于 每 个 ISP 的 行为 都 是 本 着 其 自身 的 经 济 利益 考虑 ， 
这 种 状况 仍 会 继续 长 期 存在 。 更 进一步 地 说 ， 地 域 间 的 行为 模式 的 巨大 差异 只 是 一 个 
表象 ， 其 根源 可 能 在 于 更 深层 的 结构 特性 ， 而 且 也 不 一 定 能 随 着 时 间 的 推移 因 连接 性 
和 经 济 性 的 改善 而 消失 ， 这 就 要 求 CDN 覆盖 网 能 够 路 由 越 来 越 多 的 流量 。 随 着 覆盖 
路 由 优化 越 来 越 多 地 被 采纳 ， 优 化 对 提供 底层 服务 的 ISP 的 影响 以 及 这 些 ISP 在 其 网 
络 中 进行 的 优化 都 成 为 未 来 研究 的 热门 话题 I1 


10.8 写 给 使 用 者 


经 过 十 年 的 发 展 ， 互 联网 在 技术 、 媒 体 、 娱 乐 、 商 务 、 软 件 以 及 政府 等 各 个 层面 上 
都 采用 了 CDN 技术 ，CDN 无 疑 在 促进 互联 网 业务 方面 扮演 了 一 个 中 心 角色 。 年 复 一 年 ， 
经 CDN 技术 加 速 的 流量 继续 呈现 跳跃 式 增长 。 对 网 站 、 流 媒体 、 应 用 的 性 能 和 可 用 性 
进行 增强 是 一 个 双重 挑战 ， 这 已 成 为 过 去 十 年 来 CDN 技术 演化 的 一 个 基本 驱动 力 。 在 
结束 本 章 讨 论 之 前 ， 本 节 将 目光 重新 投向 这 些 挑战 以 及 CDN 未 来 的 发 展 道路 : 

1) 对 于 互联 网 上 实现 数 十 亿 元 销售 额 的 商家 ， 如 果 其 网 站 在 流量 的 高 峰 时 刻 停机 
10min， 那 么 带 来 的 损失 将 数 以 百 万 元 计 ， 并 可 能 给 用 户 带 来 极 坏 的 印象 ”。 不 仅 如 
此 ， 电 子 商务 的 收入 正 以 显著 的 速率 增长 ， 预 计 每 隔 两 三 年 就 会 翻 一 番 。 越 来 越 多 的 证 
据 表 明 ， 网 页 的 快速 下 载 可 以 促使 电子 商务 网 站 的 更 大 发 展 ， 并 带 来 更 高 的 收入 。 这 就 
需要 实现 很 少 停机 或 没有 停机 的 更 高 目标 ， 以 便 将 内 容 更 好 地 分 发 到 互联 网 上 。 

2) 对 于 一 些 大 的 媒体 和 娱乐 公司 ， 它 们 通过 互联 网 将 内 容 分 发 给 大 量 的 终端 用 
户 。 用 户 喜欢 网 络 流 媒体 ， 是 因为 它 可 以 提供 给 用 户 任何 感 兴趣 的 内 容 ， 同 时 用 户 也 
需要 一 种 真实 的 、 与 电视 一 样 的 体验 ， 如 视频 能 快速 启动 、 播 放 时 从 不 出 现 停顿 现 
象 ， 这 就 需要 以 比 传统 方式 更 高 的 性 能 在 互联 网 上 分 发 内 容 。 

3) 作为 主要 的 娱乐 和 新 闻 来 源 ， 随 着 互联 网 的 地 位 越 来 越 稳固 ， 一 些 内 容 提 供 
商 正 面临 着 瞬时 拥塞 的 问题 ， 这 就 需要 互联 网 能 以 一 种 灵活 的 方式 ， 在 不 降低 可 用 性 
和 性 能 的 前 提 下 将 内 容 分 发 给 终端 用 户 。 

4) 业务 外 包 、 远 程 协作 以 及 政府 通信 等 新 的 业务 趋势 ， 要 求 制订 更 明确 的 性 能 
和 可 用 性 标准 ， 这 些 标准 不 只 是 局 限于 一 个 国家 或 一 小 部 分 国家 ， 而 应 该 是 全 球 性 
的 。 通 过 互联 网 形成 一 个 大 的 虚拟 团队 ， 其 成 员 即 使 分 布 于 全 球 也 能 实时 地 在 一 个 项 
目 中 分 工 合作 ， 这 种 情况 正在 变 得 越 来 越 普 遍 。 不 仅 如 此 ， 互 联网 中 很 多 新 应 用 具有 
比 以 往 更 严格 的 性 能 要 求 。 交 互 类 应 用 〈 如 虚拟 专用 网 络 上 的 远程 外 壳 和 多 用 户 游 
R) 和 新 兴 技 术 (如 下 电话 ) 都 对 延 时 具有 高 度 的 敏感 性 。 这 就 需要 满足 新 的 、 更 
严格 的 可 用 性 要 求 和 性 能 要 求 ， 以 支持 下 一 代 的 互联 网 应 用 。 

这 些 挑战 将 继续 推动 该 领域 向 前 发 展 ， 并 对 CDN 的 发 展 产生 深远 的 影响 。 
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第 11 章 ”缓解 瞬时 拥塞 的 动态 CDN 


Norihiko Yoshida 
11.1 引言 


随 着 互联 网 信息 量 的 快速 增长 和 网 络 浏览 者 随时 随地 接 入 网 络 ， 瞬 时 拥塞 (flash 
crowd) 这 个 互联 网 上 新 的 拥塞 现象 已 成 为 传统 技术 难以 解决 的 问题 。 瞬 时 拥塞 指 在 
特定 Web 站 点 突然 出 现 的 不 可 预计 的 请 求 流量 瞬间 暴涨 现象 。 与 持续 的 互联 网 拥塞 
不 同 的 是 ， 瞬 时 拥塞 会 带 来 短期 拥塞 现象 ， 造 成 Web 站 点 过 度 配 置 、 托 管 CDN 效率 
低下 和 资源 浪费 。 因 此 ， 瞬 时 拥塞 对 互联 网 提出 了 新 的 挑战 。 

“瞬时 拥塞 ”这 个 术语 最 早出 现 于 科幻 小 说 作家 Larry Niven 于 1973 年 创作 的 短 
篇 小 说 《瞬时 拥塞 》2 。 在 小 说 中 ， 价 格 低廉 和 方便 易 用 的 心灵 传输 方式 使 得 全 球 数 
以 万 计 的 人 在 瞬间 同时 涌 向 任何 感 兴趣 的 场景 地 点 ， 导 致 了 无 序 和 骚乱 。 

该 术语 随后 于 20 世纪 90 年 代 后 期 被 用 于 描述 互联 网 上 的 类 似 情 况 。 当 一 个 Web 
站 点 受到 大 量 用 户 的 访问 时 ， 往 往 会 导致 出 人 意料 的 流量 激增 ， 使 得 网 络 迅速 饱和 及 
服务 器 瘫痪 ， 从 而 导致 该 网 站 暂时 无 法 访问 ， 有 时 候 也 称 为 “SlashDot 效应 ”或 
“Web 热点 "5 。 一 个 瞬时 拥塞 的 例子 如 图 11. 1 所 示 '"“ ， 该 事件 发 生 在 2005 年 11 月 
3 HÉJ “LIVE! ECLIPSE” Wy" 。 

瞬时 拥塞 并 不 常见 ， 它 与 一 般 的 时 变 工作 负载 ( 如 每 日 时 段 效应 ) 不 同 。 例 
如 ， 很 多 人 喜欢 在 午餐 时 间 浏 览 网 页 ， 而 这 种 长 期 的 周期 性 趋势 可 以 被 预测 出 来 。 然 
而 ， 瞬 时 拥塞 很 容易 发 生 ， 例 如 所 有 用 户 同 时 对 某 个 热门 网 站 快速 浏览 片刻 就 能 产生 
一 个 瞬时 拥塞 。 因 为 发 生 频 率 越 来 越 高 以 及 整体 上 的 不 可 预见 性 ， 瞬 时 拥塞 已 经 成 为 
大 多 数 网 站 的 琼 手 问 题 。 

一 个 传统 CDN 在 请 求 负 载 相对 稳定 的 情况 下 能 够 正常 工作 。 然 而 ， 这 种 CDN 被 
称 为 静态 CDN， 原 因 在 于 它 一 直 在 使 用 固定 数量 的 代理 缓存 服务 器 (surrogate) T 
作 ， 并 且 它 一 直 处 于 待机 状态 。 如 果 都 按 应 对 瞬时 拥塞 的 要 求 使 用 高 级 别 的 资源 配 
置 ， 就 会 导致 资源 效率 低下 。 因 为 高 负载 的 罕见 性 ， 静 态 CDN 会 使 资源 的 利用 效率 
低下 ， 并 且 大 多 数 代理 缓存 服务 器 多 数 时 间 内 都 处 于 空闲 状态 。 

另外 ，Web 请 求 可 以 是 瞬间 爆发 式 的 。 预 测 瞬时 拥塞 的 负载 峰值 非常 困难 。 即 
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图 11.1 20054E11 H3 H "LIVE! ECLIPSE” 站 点 发 生 的 瞬时 拥塞 


使 是 一 个 配置 完善 的 CDN SAR, ABA AT BER AA AT PL it TE 

为 了 解决 瞬时 拥塞 问题 ， 目 前 已 提出 了 若干 解决 方案 。 一 个 可 行 的 方式 应 当 遵循 
这 样 一 个 原则 : 将 静态 CDN 改造 为 自 适 应 性 的 动态 CDN。 这 样 一 来 ， 网 站 通过 所 观 
测 到 的 流量 负载 就 能 够 自 适应 性 地 调整 自身 结构 ， 从 而 达到 最 佳 的 性 能 。 当 负载 处 于 
可 控 范 围 时 ， 正 常情 况 下 的 客户 端 / 服 务 器 配置 就 能 够 应 对 用 户 的 请 求 ; 而 当 负 载 超 
过 某 个 阔 值 或 满足 特定 条 件 时 ， 代 理 缓存 服务 器 集 开始 处 理 大 量 的 请 求 。 通 过 这 种 方 
式 ， 网 站 在 资源 利用 上 更 加 高 效 ， 可 更 好 地 解决 瞬时 拥塞 ， 同 时 多 数 Web 站 点 也 负 
担 得 起 这 样 的 配置 方式 。 

在 此 方面 ， 一 般 而 言 需要 面临 三 个 主要 挑战 : 

1) 如 何 快速 组 织 一 个 代理 缓存 服务 器 的 临时 覆盖 网 。 代 理 缓存 服务 器 应 当 被 有 
效 地 利用 ， 并 且 在 面临 瞬时 拥塞 时 需要 及 时 彼此 合作 。 当 瞬时 拥塞 消失 时 ， 一 切 应 当 
恢复 原样 ， 不 需要 增加 其 他 系统 的 开销 。 在 正常 工作 时 ， 一 台 代理 缓存 服务 器 所 带 来 
的 潜在 影响 应 当 被 控制 得 尽 可 能 小 。 

2) 如 何 恰当 地 检测 流量 峰值 的 抵达 和 消失 。 瞬 时 拥塞 与 正常 的 工作 负载 不 同 ， 
其 幅 值 和 延续 时 间 取 决 于 用 户 对 某 些 突 发 性 事件 的 兴趣 所 在 ， 因 此 很 难 提前 做 出 巴 
测 。 也 就 是 说 ， 网 络 必须 要 通过 短期 快速 预警 来 应 对 瞬时 拥塞 的 出 现 。 因 此 ， 对 瞬时 
拥塞 的 检测 必须 做 到 小 心 谨慎 ， 因 为 任何 不 恰当 的 检测 都 可 能 导致 网 络 架构 的 剧变 和 
资源 的 浪费 。 

3) 如 何以 透明 的 方式 将 用 户 请 求 重 定向 到 临时 覆盖 网 中 。 针 对 瞬时 拥塞 的 CDN 
动态 架构 一 旦 做 好 准备 ,海量 用 户 请 求 就 必须 迅速 被 重 定向 到 代理 缓存 服务 器 ， 并 且 
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这 些 请 求 应 当 以 一 种 负载 均衡 的 方式 被 重 定 向 。 与 单一 站 点 机 制 不 同 (那里 使 用 本 
地 负载 均衡 系统 )， 动态 CDN 的 重 定向 必须 在 大 尺度 的 临时 架构 环境 中 执行 。 

本 章 提出 了 FCAN (瞬时 拥塞 缓解 网 络 ) ， 这 是 一 种 动态 CDN， 能 够 自 适应 地 在 
C/S 和 CDN 配置 之 间 优 化 网 络 架构 。 我 们 使 用 了 一 种 缓存 代理 服务 器 (cache proxy) 
的 互联 网 设施 来 组 织 起 代理 缓存 服务 器 之 间 的 暂时 性 覆盖 。 当 瞬时 拥塞 抵达 时 ， 该 模 
式 将 被 实时 激活 ， 而 当 正常 情况 下 的 C/S 配置 能 够 驾驭 时 ， 该 模式 将 停止 使 用 ””。 

本 章 的 结构 如 下 ，11. 2 节 给 出 了 瞬时 拥塞 的 简介 ， 并 分 析 了 其 产生 条 件 、 类 型 
和 特性 。 除 此 之 外 ，11. 2 节 还 讨论 了 如 何 将 瞬时 拥塞 与 其 他 类 似 的 互联 网 现象 ， 如 
拒绝 服务 (DoS) 攻击 和 分 布 式 拒绝 服务 (DDoS) 攻击 进行 区 分 ， 并 介绍 了 该 领域 
的 研究 现状 ， 通 过 分 析 和 比较 若干 相关 的 解决 方案 ， 列 出 了 它们 的 优 缺 点 。11.3 市 
提出 了 FCAN, ， 它 规定 了 网 络 如 何 应 对 瞬时 拥塞 的 开始 和 结束 ， 以 及 如 何 组 织 代理 组 
存 服务 器 及 它们 相互 之 间 的 临时 协作 ， 该 节 同 时 介绍 了 基于 DNS 的 重 定向 技术 如 何 
帮助 源 Web 站 点 分 担负 载 ， 并 给 出 了 使 用 真实 工作 负载 下 的 仿真 结果 。11. 4 市 总 结 
了 若干 富有 远见 的 观点 ; 11.5 节 给 出 了 开放 性 问题 和 相关 的 未 来 研究 方向 ; 11.6 市 
进行 了 总 结 。 


11.2 ”背景 和 相关 工作 


本 节 从 研究 瞬时 拥塞 的 特性 开始 。 我 们 的 研究 表明 ， 网 络 带 宽 是 最 严重 的 瓶颈 ， 
并 且 绝 大 部 分 的 请 求 仅 仅 涉 及 一 小 部 分 对 象 《也 就 是 所 谓 的 重 尾 行为 特征 ) 。 这 些 现 
象 表明 ， 将 大 量 请 求 通过 重 定向 方式 引 离 源 服 务 器 ， 并 对 那些 导致 瞬时 拥塞 的 对 象 进 
行 缓存 ， 这 可 能 是 一 种 有 效 的 解决 方案 。 本 领域 的 相关 研究 显示 ， 目 前 处 理 瞬 时 拥塞 
问题 的 解决 方案 还 存在 着 很 大 的 潜力 。 


11.2.1 瞬时 拥塞 


一 般 而 言 ， 无 论 有 意 还 是 无 意 ， 公 众 感 兴趣 的 突 发 事件 会 导致 瞬时 拥塞 ， 著 名 的 
例子 包括 1998 4 ttt RK | RedHat Linux 镜像 发 布 @] Play - along TV show 2000, 
1999 年 的 智利 大 选 广播 "以 及 2001 年 9 月 11 A CNN XPRESS, BR 
之 外 ,一 个 Web 站 点 如 果 与 某 个 流行 内 容 、 新 闻 或 者 博客 相关 ， 就 会 引发 大 量 的 突 
发 访问 。 

因为 资源 和 (或 ) 网 络 带宽 的 限制 ， 服 务 器 经 常 无 法 处 理 海 量 请 求 。 因 此 ， 大 
多 数 用 户 将 明显 感觉 到 网 络 性 能 的 下 降 。 另 外 , 在 发 生 瞬 时 拥塞 时 ， 与 相关 服务 器 共 
享 带宽 的 其 他 用 户 将 无 法 得 到 服务 ， 同 时 也 有 可 能 歌 及 在 该 服务 器 检索 其 他 信息 的 用 
Puig, 

通过 以 上 的 分 析 和 其 他 研究 结果 '"  ， 我 们 能 够 得 到 一 些 关 于 瞬时 拥塞 的 重要 
特性 和 结论 (将 在 下 面 列 出 ) 。 这 些 观测 结果 能 够 使 我 们 预知 瞬时 拥塞 何 时 抵达 、 需 
要 采取 相应 行动 的 时 间 (多 长 或 多 短 ) 、 瞬 时 拥塞 和 恶意 攻击 的 区 别 以 及 我 们 如 何 利 
用 Web 站 点 的 本 地 性 等 。 
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1) 瞬时 拥塞 发 生 时 ， 虽 然 持续 时 间 很 得 ， 但 单位 时 间 内 请 求 量 的 增加 是 惊人 
的 。 瞬 时 拥塞 取决 于 用 户 关注 度 的 持续 时 间 ， 从 数 小 时 到 几 天 不 等 ， 与 Web 应 用 的 
生命 周期 相 比较 短 。 因 此 ， 如 果 使 用 过 度 配 置 的 办 法 或 转 而 使 用 传统 CDN， 结 果 可 
能 会 导致 在 正常 运行 周期 内 资源 的 低 效 利用 ， 尤 其 是 对 于 小 型 网 络 或 者 私有 的 Web 
站 点 ， 因 为 这 些小 型 站 点 在 整个 运营 期 内 也 不 会 遇见 几 次 瞬时 拥塞 。 

2) 瞬时 拥塞 期 间 请 求 的 增长 速度 很 快 ， 但 非 瞬 时 爆发 。 在 Play — along TV show 
的 例子 中 ， 请 求 率 经 过 长 达 15min 才 达 到 顶峰 。 在 另 一 个 例子 中 ，2001 年 的 9 - 11 事 
件 导 致 了 CNN 网 站 的 巨大 负载 ， 访 问 数 平均 每 7min 翻 一 番 ， 最 终 达 到 了 20 倍 于 日 
常 负载 的 峰值 ” 。 这 个 特性 表明 ， 系 统 有 足够 的 时 间 去 检测 到 瞬时 拥塞 并 做 出 及 时 
的 反应 。 

3) 瞬时 拥塞 中 网 络 带 宽 是 一 个 主要 的 约束 瓶颈 。 如 果 服 务 器 提供 动态 生成 内 容 
的 相关 服务 ， 那 么 CPU 也 可 能 成 为 性 能 瓶颈 。 例 如， 在 9 11 事件 发 生 当天 的 上 午 ， 
MSNBC 新 闻 网 站 动态 页 面 出 现 的 出 错 信 息 中 ， 大 约 49. 4% 是 代码 为 500 的 错误 CAR 
务 器 繁忙 信号 ) 。 然 而 ，MSNBC 迅速 切换 到 了 静态 HTML 页 面 服务 ， 使 500 错误 
的 出 现 率 降 低 到 6.7% 。 相 关 观 测 也 表明 ， 网 络 带宽 是 主要 的 瓶颈 ， 而 且 离 服务 器 越 
近 所 受 影响 越 大 ” 。 有 报道 指出 ， 现 在 桌面 服务 器 能 够 在 提供 静态 文件 服务 时 达到 
1Gbit/s 的 网 络 吞吐 量 ， 而 Web 站 点 的 网 络 带 宽 相 对 而 言 要 小 得 多  ， 因 此 ， 我 们 应 
该 重点 关注 如 何 减 轻 服务 器 周围 的 网 络 带 宽 瓶 颈 。 

4) 约 有 不 到 10% 的 内 容 占 据 了 超过 90% 的 访问 请 求 。 例 如 ，MSNBC Ay H zs S 
Am, 在 9.11 当天 超过 90% 的 访问 仅仅 针对 141 个 文件 (0.37% ) ， 而 1086 个 文件 
(2.87%) 占据 了 99% 的 访问 量 '”。 另 外 ， 在 瞬时 拥塞 中 访问 量 大 的 内 容 一 般 不 多 ， 
缓存 完全 可 以 装 得 下 。 这 是 一 个 重要 结果 ， 意味 着 针对 10% 左右 内 容 的 缓存 大 小 可 
作为 瞬时 拥塞 的 解决 方案 。 我 们 也 观测 到 ， 这 种 “10/90” 规 则 服从 Zipf - like 分 布 ， 
其 中 一 个 针对 第 i 个 最 受 关注 的 内 容 的 请 求 的 相对 概率 与 1/i? 成 正比 ""。 这 个 特性 
将 瞬时 拥塞 与 由 僵尸 程序 (bots) 产生 的 攻击 流量 区 分 开 来 。 

5) 在 瞬时 拥塞 期 间 超 过 60% 的 内 容 只 被 访问 一 次 。 另 外 ， 在 上 面 所 提 及 的 10% 
的 热点 内 容 中 ， 又 有 超过 00% 左右 是 新 添加 的 缓存 内 容 。 例 如 ， 在 Paly — along 案例 
中 61% 的 内 容 是 未 缓存 的 ， 在 Chile 案例 中 82% 的 内 容 是 未 缓存 的 。 这 表明 , 一 
般 的 Web 缓存 难以 提供 系统 期 望 的 保护 水 平 。 大 多 数 互联 网 上 的 缓存 代理 服务 器 
(cache proxy) 在 瞬时 拥塞 开始 时 都 不 会 存 有 用 户 所 请 求 的 内 容 ， 因 此 大 多 数 请 求 都 
不 会 在 缓存 中 得 到 服务 ， 而 是 被 转发 给 源 服务 器 。 尽 管 接 下 来 的 后 继 请 求 可 能 在 缓存 
中 能 够 得 到 服务 ， 但 大 多 数 初始 时 的 缓存 缺失 都 会 在 开始 很 短 一 个 时 期 内 发 生 ， 并 使 
请 求 被 转发 至 源 服务 器 。 

6) 在 一 次 瞬时 拥塞 中 用 户 的 数量 与 单位 时 间 内 的 请 求 率 相同 ， 这 个 特点 使 之 区 
别 于 恶意 请 求 。 在 一 次 瞬时 拥塞 中 ， 请 求 流量 的 峰值 对 应 于 访问 站 点 的 用 户 数 峰值 ， 
流量 增加 很 大 程度 上 源 于 用 户 数量 的 激增 ， 而 且 大 多 数 请 求 来 自 大 量 的 用 户 群 。 然 
而 ， 因 为 在 瞬时 拥塞 中 一 台 服务 器 的 响应 经 常会 慢 下 来 ， 所 以 每 用 户 请 求 率 要 比 平时 
低 ， 这 表明 是 那些 正常 用 户 在 影响 着 服务 器 的 性 能 。 
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在 研究 瞬时 拥塞 行为 时 ， 我 们 需要 区 分 某 些 相关 但 不 同 的 现象 ， 即 DoS 攻击 。 一 
个 DoS 攻击 是 一 种 “让 目标 主机 停止 向 合法 用 户 提供 服务 或 资源 访问 ”的 攻击 ， 
它 通 过 海量 数据 包 冲击 目标 主机 ， 使 其 所 有 可 用 网 络 资源 都 被 消耗 列 尽 ， 最 后 导致 合 
法 的 用 户 请 求 无 法 进入 ， 系 统 无 法 正常 运行 。 一 些 常见 的 DoS 攻击 包括 SYN 攻击 、 
Code Red Jit; 7", Password Cracking!" 等 ， 还 有 就 是 最 近 常 被 提 及 的 DDoS Xt, 
这 是 一 种 通过 大 量 被 植 入 木马 程序 的 受 控 计算 机 发 送 海量 请 求 到 目标 的 攻击 。 

DoS 攻击 和 瞬时 拥塞 有 诸多 相同 点 ， 它 们 都 使 服务 器 的 互联 网 连接 过 载 ， 并 导致 
服务 器 部 分 或 者 完全 失效 。 然 而 ， 服 务 器 应 当 在 处 理 瞬 时 拥塞 时 忽略 DoS 攻击 ， 而 仅 
处 理 正常 用 户 的 请 求 。 

与 瞬时 拥塞 相 比 ，DoS 攻击 具有 以 下 明显 特征 ”: Q@ 用 户 在 ISP 和 网 络 中 的 分 布 并 
不 服从 总 体 分 布 (population distribution); @ 在 遭遇 攻击 前 和 被 攻击 中 一 个 网 站 的 用 户 
群 的 重生 部 分 是 非常 小 的 ; @ 用 户 请 求 率 在 攻击 中 是 稳定 的 ， 并 且 与 正常 值 偏离 较 大 ; 
@ 攻 击 的 目标 文件 (未 必 存 在 于 服务 器 上 ) 的 分 布 不 可 能 是 Zipf - like 分 布 。 

通过 探寻 这 些 不 同 ,一 台 服 务 器 有 可 能 采取 措施 来 区 分 DoS 攻击 和 瞬时 拥塞 ， 并 
尽早 丢弃 那些 恶意 请 求 。 服 务 器 可 以 监控 访问 站 点 的 用 户 以 及 他 们 的 请 求 率 ， 并 对 包 
的 内 容 、HTTP 头 和 抵达 率 执行 相关 检查 。 

关于 如 何 区 别 亚 意 请 求 和 合法 用 户 请 求 的 更 多 细节 和 相关 实现 并 不 是 本 书 要 讨论 
的 范围 ， 详 细 资 料 可 参见 参考 文献 [21, 22, 35 ] 。 本 章 假定 ， 服 务 器 能 够 通过 某 些 机 
制 来 滤 除 来 自 DoS 攻击 的 恶意 请 求 。 


11.2.2 可 行 方 案 


根据 网 络 的 典型 架构 ， 目 前 用 于 解决 瞬时 拥塞 的 方法 可 以 分 为 三 大 类 : 服务 器 
层 、 中 间 层 和 客户 端 层 ， 如 图 11. 2 所 示 。 


naa] con LJ LJ 


图 11.2 三 种 解决 方案 
a) 服务 器 层 b) 中 间 层 c) 客户 端 层 
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1. 服务 器 层 解决 方案 

如 上 所 述 ， 在 服务 器 端 使 用 过 度 配置 和 静态 CDN 的 传统 方法 较为 直接 ,但 缺点 
是 很 耗资 源 ”' 一 ” 。 此 类 方法 性 能 低下 ， 难 以 处 理 短期 内 的 互联 网 拥塞 现象 。 由 于 瞬 
时 拥塞 的 不 可 预见 性 ， 任 何不 完备 配置 的 系统 都 会 在 持续 过 载 条 件 下 出 现 问题 。 

(1) 带 有 动态 委托 的 CDN 

Jung 等 人 "提出 了 一 种 自 适 应 的 CDN 结构 ， 在 过 载 情况 下 使 用 动态 委托 (dy- 
namic delegation) 对 源 服 务 器 实现 保护 。 该 方法 将 代理 缓存 服务 器 (surrogate server) 
组 织 成 不 同 的 组 ， 每 一 个 组 内 会 指定 一 台 作 为 主 服务 器 。 一 般 情 况 下 ，CDN 中 的 
DNS 服务 器 会 将 用 户 请 求 只 分 配 至 主 服务 器 。 当 主 服务 器 的 负载 达到 警戒 值 时 ， 主 
服务 器 会 请 求 DNS 将 请 求 分 派 至 组 内 其 他 成 员 ， 这 个 被 委托 的 服务 器 称 为 “代表 ” 
(delegate) 。 当 一 个 代表 收 到 一 个 缓存 中 缺失 的 请 求 时 ， 它 将 该 请 求 转 发 到 主 服务 器 
而 非 源 服务 器 上 。 这 种 机 制 称 为 “动态 委托 ”， 当 代表 参与 进来 后 ， 系 统 的 整体 表现 
与 协作 式 缓存 相似 。 

如 前 所 述 ， 动 态 委托 机 制 能 够 在 瞬时 拥塞 初期 处 理 60% 左右 的 未 缓存 对 象 ， 并 
提高 了 系统 的 效率 。 它 将 高 访问 量 的 对 象 从 源 服务 器 中 取出 ， 通 过 分 级 缓存 机 制 来 消 
化 造成 缓存 缺失 的 请 求 。 然 而 ， 配 备 主 服务 器 的 代理 缓存 服务 器 组 需要 进行 手动 配 
置 ， 并 且 一 旦 配置 完毕 便 不 能 改变 ， 甚 至 在 正常 运行 期 也 是 如 此 。 

(2) DotSlash 方法 

DotSlash 方法 名 允许 不 同 的 Web 站 点 组 成 互助 社区 ， 并 在 社区 内 部 使 用 空闲 的 
服务 器 容量 来 缓解 单一 站 点 在 瞬时 拥塞 期 间 的 压力 。 作 为 一 个 救援 系统 ，DotSlash 持 
续 不 断 地 监控 每 一 台 Web 服务 器 的 工作 负载 。 当 一 台 服 务 器 过 载 时 ， 救 援 服务 立即 
被 激活 ， 而 当 服务 器 的 负载 回 到 正常 值 时 ， 救 援 服务 即 停止 。 因 此 ，Web 站 点 具备 一 
个 动态 的 服务 器 集 ， 其 中 包含 单个 源 服务 器 或 者 固定 成 员 的 源 服务 器 构成 的 集群 ， 以 
及 一 组 数量 可 变 的 救援 服务 器 。 

与 服务 器 层 的 其 他 方法 及 下 面 将 要 提 到 的 中 间 层 方法 不 同 ，DotSlash 方法 并 不 使 
用 一 成 不 变 的 资源 ， 它 在 一 个 临时 组 成 的 服务 器 互助 社区 中 才 激 活 其 救援 系统 。 然 
而 ，DotSlash 方法 需要 客户 端 和 源 服务 器 先 建立 连接 ， 然 后 再 指定 一 个 经 过 重 定向 的 
URL (包含 有 DNS 重 定向 需要 的 虚拟 主机 名 ) 。 因 此 ， 此 处 可 能 存在 风险 ， 即 在 需要 
发 送 重 定向 报 文 时 所 需要 的 带宽 和 处 理 能 力 会 使 得 源 服务 器 失效 。 

2. 中 间 层 解决 方案 

在 应 对 瞬时 拥塞 的 问题 上 已 经 有 了 若干 中 间 层 解决 方案 ， 这 些 方案 大 多 使 用 网 络 
资源 来 进行 减负 。 缓 存 技术 可 以 用 于 解决 瞬时 拥塞 ， 通 过 过 滤 来 自 共 享 同一 台 代理 服 
务 器 缓存 (proxy cache) 的 用 户 组 的 重复 请 求 来 减轻 服务 器 的 负载 。 

一 般 而 言 ， 互 联网 上 的 代理 服务 器 (proxy) 可 被 分 为 两 种 : 前 向 代理 服务 器 和 
反 向 代理 服务 器 。 前 向 代理 服务 器 被 放置 在 客户 端 附近 ， 因 而 远离 源 服务 器 。 它 们 典 
型 的 功能 配置 包括 防火 墙 和 静态 内 容 缓存 。 前 向 代理 服务 器 通常 被 多 数 用 户 共享 ， 因 
此 需要 性 能 强大 和 稳定 可 靠 ， 不 过 内 容 提供 商 并 不 对 其 施加 过 多 控制 。 反 向 代理 服务 
器 一 般 被 放置 在 服务 器 集群 的 后 端 ， 作 为 应 用 提供 商 的 代理 (agent) 使 用 ， 代 表 后 
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端 服务 器 来 响应 用 户 请 求 。 因 此 ， 内 容 提 供 商 对 其 拥有 完全 的 控制 权 。 然 而 ， 反 向 代 
理 的 可 拓展 性 只 能 由 内 容 提供 商 的 网 络 带宽 决定 “| 。 

(1) 多 层 缓存 

多 层 缓存 方法 所 认为 ， 当 使 用 某 些 恰当 的 替换 算法 时 ， 设 计 出 的 用 于 处 理 正 常 
Web 负载 的 某 种 缓存 设施 也 足以 应 对 瞬时 拥塞 。 该 方案 分 别 研 究 了 使 用 不 同 缓存 替 
换算 法 、 改 变 缓存 放置 地 点 、 使 用 异 质 性 多 层 缓 存 以 及 将 基于 文档 大 小 的 ID 空间 分 
区 的 效果 。 研 究 结果 表明 ， 通 过 使 用 GDSF 算法 ' ,缓存 中 的 蔡 换 策略 能 够 对 用 户 响 
应 时 间 、 服 务 器 和 网 络 负载 产生 非常 明显 的 改善 。 

多 层 缓存 技术 为 使 用 缓存 来 解决 小 型 、 静 态 对 象 的 瞬时 拥塞 问题 提供 了 很 好 的 解 
决 方案 。 此 系统 需要 对 缓存 进行 精细 的 分 层 部 署 ， 并 且 需 要 对 前 向 缓存 代理 服务 器 的 
设施 架构 拥有 完全 控制 权 。 此 系统 并 没有 解决 60 多 未 缓存 对 象 的 问题 ， 因 此 可 能 无 
法 提供 对 源 服务 器 更 好 的 初期 保护 。 另 外 ， 此 类 技术 目前 仍 缺 乏 用 于 灵活 处 理 瞬 时 拥 
塞 的 自 适 应 机 制 。 

(2) BackSlash 

BackSlash ^ 技术 使 用 基于 分 布 式 哈 希 表 (DHT) 的 内 容 可 寻 址 的 P2P 覆盖 技术 
来 建立 分 布 式 Web 服务 器 系统 。 它 将 内 容 的 副本 存放 于 由 内 容 提 供 商 指定 的 镜像 服 
Fizo DHT 提供 了 参与 者 自 组 织 、 请 求 路 由 和 负载 均衡 的 基础 。 

BackSlash 方法 使 用 Web 服务 器 和 代理 服务 器 来 对 网 络 流量 进行 分 流 。 然 而 ， 在 
BackSlash 中 镜像 服务 器 上 的 内 容 必须 提前 配置 好 并 且 进 行 妥 善 组 织 ， 这 增加 了 运行 
的 复杂 度 并 限制 了 系统 的 可 拓展 性 。 

(3) CoralCDN 

CoralCDN " 利用 志愿 者 的 带宽 对 大 多 数 使 用 该 系统 的 Web 站 点 流量 进行 消化 和 
分 流 。 在 第 1 章 已 经 提 到 ，CoralCDN 在 “ 键 值 /索引 ”架构 上 使 用 了 覆盖 路 由 技术 ， 
即 一 个 P2P 的 分 布 式 散 列 蛤 希 表 (DSHT) 能 够 允许 节点 对 附近 Web 对 象 的 缓存 副本 
进行 定位 ， 而 无 须 查询 远程 节点 ， 这 也 同时 避免 了 架构 中 热点 的 出 现 ， 即 使 在 负载 恶 
化 时 也 是 如 此 。 为 了 使 用 CoralCDN ， 内 容 发 布 者 或 提供 连接 到 高 流量 端口 的 管理 员 
需要 将 URL 的 主机 名 后 附加 “. nyud. net; 8090” , 

Coral 使 用 志愿 者 的 带宽 资源 来 消化 巨大 的 流量 ， 它 将 一 组 基于 P2P 的 反 向 代理 
服务 器 合并 起 来 ， 创 建 按 需 提供 的 缓存 对 象 ， 并 使 DNS 以 透明 方式 重 定向 用 户 请 求 。 
CoralCDN 总 是 等 待 请 求 的 进入 ， 请 求 的 URL 需要 手动 添加 “. nyud. net; 8090”。URL 
经 过 修改 之 后 ，CoralCDN 即 能 进行 面向 对 象 的 重 定向 ， 然 而 它 牺牲 了 系统 对 用 户 的 
透明 性 。 

3. 客户 端 层 解决 方案 

客户 端 层 解决 方案 通过 利用 客户 端 之 间 的 协作 和 共享 对 象 来 达到 减轻 中 心服 务 器 
负载 的 目的 。 一 台 Web 源 服务 器 可 以 将 一 个 客户 端 重 定向 到 近期 内 下 载 过 所 需 对 象 
的 另 一 个 客户 端 来 实现 客户 端 之 间 的 协作 ， 如 Squirrel?" 、PseudoservingC 和 Coop- 
Net? 。 客 户 端 也 可 以 通过 组 成 P2P 覆盖 网 并 使 用 搜索 机 制 来 定位 资源 。 例 如 ， 
PROOFS' 利用 随机 化 的 方法 来 建立 客户 端的 P2P RAR, BitTorrent 将 大 文件 分 割 
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成 小 块 便于 有 效 检索 。 一 般 而 言 ， 这 些 方法 依赖 于 客户 端的 协作 ， 它 们 需要 被 安装 在 
客户 端的 计算 机 上 ， 这 样 才 有 可 能 避免 花费 力气 在 大 范围 内 的 部 署 工作 。 

(1) CoopNet 

CoopNet (协作 网 ) 号 是 一 个 P2P 缓存 解决 方案 ， 用 于 客户 端 与 服务 器 以 及 客户 
端 与 Web 代理 服务 器 之 间 的 通信 服务 。 在 CoopNet 中 会 存在 已 经 下 载 过 内 容 的 注册 用 
户 ， 并 且 这 些 用 户 反 过 来 又 可 将 内 容 传输 给 其 他 用 户 。CoopNet 使 用 基于 HTTP HE 
定向 技术 来 路 由 请 求 ， 并 根据 请 求 附近 的 定位 信息 来 选择 其 对 等 成 员 。 

在 CoopNet 中 ，P2P 通信 在 瞬时 拥塞 出 现时 被 激活 并 分 担负 载 ， 在 C/S 通信 工作 
正常 时 停止 工作 。CoopNet 使 用 基于 服务 器 的 重 定向 会 导致 单 点 失效 的 风险 。 

(2) PROOFS 

PROOFS'” 仿 由 两 个 协议 组 成 : 第 一 个 构成 并 维护 网 络 覆 盖 ; 第 二 个 在 第 一 层 形 
成 的 覆盖 模式 上 执行 一 系列 随机 的 广 域 对 象 搜索 。 节 点 持续 执行 一 种 被 称 为 “ 洗 牌 
策略 ”的 交换 模式 。 所 谓 洗 牌 策略 ， 就 是 在 客户 端 对 之 间 的 邻 子 集中 的 彼此 交换 ， 
并 可 通过 任意 客户 端 进行 初始 化 。 洗 牌 的 目的 是 形成 一 个 充分 混合 的 覆盖 ， 因 为 一 个 
客户 端的 邻居 是 通过 随机 方式 从 所 有 参与 到 覆盖 的 客户 端 集中 提取 出 来 的 。 一 旦 达到 
一 个 随机 状态 ， 广 域 对 象 搜索 便 在 覆盖 网 络 上 开始 进行 。 对 象 随机 访问 邻居 集 ， 直 到 
找到 一 个 包含 该 对 象 的 节点 。 通 过 理论 分 析 和 仿真 实验 ，PROOFS 据 称 能 够 在 覆盖 分 
区 、 对 等 成 员 动 态 加 入 /离开 系统 及 限制 参与 系统 等 方面 表现 出 很 好 的 鲁 棒 性 。 

PROOFS 使 用 了 非 结 构 化 的 第 一 代 P2P 系统 ， 因 此 配置 简单 且 成 本 低廉 ， 并 在 面 
对 瞬时 拥塞 时 具有 良好 的 性 能 。 现 在 研究 重点 都 集中 在 第 二 代 P2P 系统 架构 上 ， 如 
CANU* . CHORD) 和 Pastry ™ ， 在 这 些 系统 中 参与 者 比较 清楚 请 求 应 该 如 何 转发 。 
他 们 能 够 提供 第 一 代 系 统 所 不 具备 的 带宽 使 用 优势 和 定位 文件 所 需 的 时 间 优 势 。 不 
过 ， 如 果 想 处 理 好 那些 访问 量 突然 激增 的 文档 ， 同 时 还 要 保护 好 提供 这 些 文档 服务 的 
服务 器 节点 ， 那 么 第 一 代 架 构 (它们 更 简单 且 更 轻 量 级 ) 则 是 理想 的 选择 。 

4. 其 他 工作 

网 格 技术 能 够 解决 在 动态 的 多 组 织 机 构 间 彼此 协作 时 的 资源 共享 问题 “! ， 它 主 
要 关注 大 尺度 的 计算 问题 以 及 包括 多 用 户 和 不 同类 型 的 行为 与 交互 等 的 复杂 应 用 问 
题 。 互 联网 数据 中 心 利用 共享 的 硬件 资源 托管 多 个 Web 应 用 。Chandra 等 人 通过 将 资 
源 重新 分 配 到 过 载 应 用 来 动态 改变 应 用 的 负载 ， 也 就 是 说 ， 在 必要 时 从 那些 资源 并 未 
得 到 充分 利用 的 应 用 中 “ 借 ” 资 源 '"。 

在 另 一 个 方法 中 ， 一 个 Web 站 点 可 以 使 用 访问 控制 ”"”， 通 过 拒绝 一 部 分 用 
户 请 求 并 有 选择 性 地 服务 特定 用 户 来 避免 过 载 。 


11.3 FCAN: 瞬时 拥塞 缓解 网 络 


FCANW" 世 是 一 个 中 间 层 解决 方案 ， 它 使 用 类 似 于 CDN 的 缓存 代理 服务 器 的 大 范 
围 覆盖 网 络 来 存储 对 象 ， 并 将 对 象 传递 到 客户 端 ， 这 与 CDN 中 的 代理 缓存 服务 器 类 
似 。 考 虑 到 瞬时 拥塞 的 不 可 预见 性 以 及 较 短 的 持续 时 间 ，FCAN 仅 当 一 台 服务 器 过 载 
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时 才 激 活 覆 盖 架 构 ， 并 在 必要 时 重新 组 织 覆 盖 。 与 上 文 已 提 及 的 大 部 分 方法 相 比 ， 这 
种 动态 性 是 FCAN 最 重要 的 特性 。 唯 一 的 例外 是 DotSlash ， 不 过 它 缺 乏 自 适应 的 重组 
织 特性 。 

FCAN 的 目的 在 于 完善 现 有 的 Web 服务 器 设施 ， 以 便 能 有 效应 对 短期 性 的 负载 暴 
增 。FCAN 目的 并 不 是 为 那些 长 期 超过 Web 站 点 负载 能 力 的 请 求 而 设计 的 ， 因 此 它 针 
对 的 仅仅 是 小 型 的 Web 站点， 虽然 大 型 Web 站 点 也 能 通过 FCAN 实现 有 效 运转 。 


11.3.1 需求 


下 面 列 出 让 FCAN 能 有 效 、 可 靠 及 经 济 运行 所 需 的 功能 性 和 非 功 能 性 的 系统 
需求 。 

(1) 对 象 分 发 

第 一 位 也 是 最 重要 目的 是 内 容 对 象 的 及 时 发 布 。FCAN 应 在 任何 时 候 都 能 维护 内 
容 分 发 服务 的 高 可 靠 性 。 另 外 ，FCAN 也 应 该 确保 对 服务 器 上 非 瞬 时 拥塞 对 象 的 可 访 
问 性 。 

(2) 工作 负载 控制 

FCAN 应 该 能 够 监控 负载 增加 的 情况 并 对 其 进行 控制 ， 使 服务 器 不 至 于 过 载 。 同 
时 ， 当 海量 请 求 被 临时 性 的 代理 缓存 服务 器 分 流 时 ，FCAN 应 当 在 每 一 台 代 理 缓 存 服 
务 器 上 对 工作 负载 进行 监控 ， 并 检测 瞬时 拥塞 现象 的 消失 和 控制 重 定 向 的 请 求 ， 使 代 
理 缓 存 服务 器 不 至 于 出 现 过 载 的 情况 。 

(3) 自 适应 转换 

FCAN 应 当 能 够 对 负载 增加 的 情况 保持 足够 的 敏感 ， 并 能 够 以 自 适 应 的 灵活 方式 
来 改变 自身 的 架构 ， 以 获得 最 佳 性 能 输出 。 由 于 架构 的 转换 时 间 和 持续 时 间 应 当 尽 量 
短 ， 所 以 检测 和 转换 都 应 当 以 自动 方式 完成 。 

(4) 请 求 重 定向 

FCAN 需要 通过 恰当 的 机 制 找到 临时 的 代理 缓存 服务 器 并 重 定向 海量 请 求 。 不 仅 
如 此 ，FCAN 也 要 能 选择 最 合适 的 代理 缓存 服务 器 。 如 果 执 行 的 重 定向 能 够 在 全 局 上 
实现 均衡 ， 这 种 机 制 就 是 理想 的 。 
(5) 客户 端 透明 度 
如 果 客 户 端 无 需 改变 ， 那么 FCAN 将 更 容易 被 客户 接受 。 因 此 ， 对 于 客户 端 而 
， 如 果 他 们 在 使 用 过 程 中 完全 没有 意识 到 FCAN 的 存在 ,那么 FCAN 的 目的 就 达 
到 了 。 

(6) 可 拓展 性 

因为 基于 互联 网 的 设施 具有 沟通 全 球 的 特性 ， 所 以 PCAN 要 能 够 在 最 小 代价 下 做 
到 易于 扩展 。 


11.3.2 设计 总 览 


在 正常 情况 下 ， 传 统 的 C/S 架构 能 够 处 理 大 部 分 客户 端 请 求 。 构 成 FCAN 的 一 个 
成 员 服务 器 和 成 员 缓存 代理 服务 器 在 正常 情况 下 并 不 比 普通 服务 器 优越 很 多 。 当 瞬时 
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拥塞 抵达 时 ,成员 服务 器 检测 到 了 流量 负载 的 激增 ， 它 随即 激活 部 分 成 员 代 理 服务 器 
形成 一 个 覆盖 (overlay) ， 从 而 使 所 有 的 请 求 得 到 处 理 。 随 后 的 所 有 客户 端 请 求 都 通 
过 DNS 重 定向 路 由 到 这 个 覆盖 。 如 果 这 些 代理 服务 器 还 不 足以 处 理 海量 请 求 ,新 的 
代理 服务 器 会 加 入 ， 使 覆盖 扩大 。 当 瞬时 拥塞 消失 时 ， 部 分 代理 服务 器 会 离开 覆盖 ， 
这 时 覆盖 开始 减 小 规模 ， 直 至 最 终 解 散 。 图 11. 3 给 出 了 FCAN 的 三 种 不 同 的 工作 状 
态 ， 分 别 为 常态 、 初 态 和 扩张 态 。 
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图 11.3 FCAN 概况 
a) 常态 b) MA c) 扩张 态 


FCAN 并 不 专 为 某 一 单独 成 员 服 务 器 使 用 ， 而 是 设计 为 由 多 人 台 服务 器 在 需要 时 共 
享 。 每 一 个 成 员 服 务 器 都 使 用 自己 的 覆盖 ， 不 论 该 覆盖 大 还 是 小 。 服 务 器 之 间 会 尽量 
相互 避免 重奏 过 多 。 

在 一 般 状 态 下 ， 每 一 台 成 员 代理 服务 器 通常 主要 充当 一 台 转 发 缓存 代理 服务 器 。 
不 过 ， 它 充当 的 是 代理 缓存 服务 器 ， 多 少 有 点 类 似 于 反 向 缓存 代理 服务 器 (reverse 
cache proxy) ， 在 “ 反 瞬 时 拥塞 ”模式 下 处 理 任意 客户 端的 请 求 。 在 现实 中 ， 一 个 成 
员 代理 服务 器 为 多 台 服 务 器 服务 ， 这 时 可 能 存在 一 种 情况 ， 即 某 台 服 务 器 受到 瞬时 拥 
塞 的 影响 而 其 他 的 却 没有 ， 因 此 每 一 个 成 员 代理 服务 器 都 有 混合 模式 运行 的 功能 
( 即 同 时 具备 前 向 代理 模式 和 反 向 代理 模式 ) 。 


11.3.3 瞬时 拥塞 检测 


网 络 带宽 、 服 务 器 CPU 和 内 存 等 不 同 资源 都 有 可 能 在 瞬时 拥塞 中 成 为 瓶颈 ， 不 
同 的 资源 在 测量 工作 负载 时 应 该 采用 不 同 的 指标 。 每 一 个 成 员 服务 器 都 应 完成 监控 和 
过 载 / 欠 载 检测 ， 并 相应 地 执行 动态 转换 功能 。 现 有 的 设计 仅仅 使 用 访问 到 达 率 来 作 
为 负载 的 衡量 准则 ， 并 使 用 基于 阔 值 的 技术 来 激活 动态 转换 。 

为 了 检测 瞬时 拥塞 的 到 来 ， 服 务 器 需要 周期 性 地 观测 自身 的 负载 。 一 旦 服务 器 负 
载 超过 预定 阔 值 Tuw ， 服 务 器 就 可 以 确定 瞬时 拥塞 的 出 现 。 
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在 瞬时 拥塞 期 间 ， 履 盖 中 的 每 一 个 代理 服务 器 都 有 一 个 负载 监控 系统 ， 负 责 观 测 
用 户 访问 的 数量 。 成 员 服 务 器 从 所 有 相关 的 代理 服务 器 中 定期 收集 信息 ， 如 果 这 个 履 
a PIE fa UT BUE BIB. Tu, (< Tuu ) ， 那 么 成 员 服务 器 判断 此 时 瞬时 拥塞 结束 。 


11.3.4 网 络 转换 


当成 员 服 务 器 检测 到 瞬时 拥塞 时 ， 它 将 执行 如 下 步 又 ， 使 某 些 成 员 缓存 代理 服务 
器 切换 到 反 瞬 时 拥塞 模式 ， 并 组 成 临时 的 覆盖 网 : 

1) 选择 部 分 代理 服务 器 ， 形 成 CDN 那样 的 代理 缓存 服务 器 覆盖 网 。 

2) 进行 DNS 记录 的 更 新 ， 改变 Web 站 点 的 检索 项 (也 就 是 从 服务 器 地 址 到 代 
理 服务 器 的 映射 ) ， 这 样 一 来 ， 后 继 请 求 将 在 DNS 的 帮助 下 被 重 定向 到 适当 的 代理 服 
EE P 

3) 将 涉及 瞬时 拥塞 的 对 象 传播 (推送 ) 到 选 定 的 代理 服务 器 ， 因 为 上 文 已 经 
到 ， 超 过 60% 的 瞬时 拥塞 对 象 在 海量 访问 抵达 之 前 都 是 未 经 缓存 的 。 

4) 准备 收集 相应 代理 服务 器 上 的 对 象 信息 并 评估 对 象 的 统计 特性 ， 目 的 是 确定 
动态 重组 和 将 来 覆盖 的 释放 。 

每 一 个 成 员 缓存 代理 服务 器 在 收 到 成 员 服务 器 的 请 求 后 执行 如 下 步骤 : 

1) 改变 当前 自身 模式 ， 从 代理 服务 器 模式 切换 到 代理 缓存 服务 器 模式 (或 者 从 
严格 意义 上 来 说 ， 如 前 文 所 述 包 括 前 向 代理 和 反 向 代理 的 混合 模式 ) 。 

2) 永久 性 存储 产生 瞬时 拥塞 的 对 象 ， 直 到 瞬时 拥塞 消失 。 

3) 开始 监控 请 求 率 和 负载 的 统计 数据 ， 并 周期 性 向 服务 器 报告 。 

服务 器 首先 选择 一 部 分 代理 服务 器 ， 对 它们 逐个 进行 检测 ， 这 是 因为 任意 代理 服 
务 器 都 有 可 能 正 涉及 另 一 个 瞬时 拥塞 ， 或 者 有 可 能 由 于 其 他 原因 处 于 过 载 状况 。 这 样 
做 的 目的 是 在 面临 多 个 不 同 瞬时 拥 骞 时， 避免 相应 的 代理 服务 器 子 集 相互 重 倒 。 因 
此 ， 最 终 选择 出 来 的 代理 服务 器 子 集 可 能 较 小 ， 甚 至 有 可 能 仅 含 一 台 代 理 服务 器 ， 这 
源 于 FCAN 具备 动态 重组 的 特性 ， 后 面 将 详细 介绍 。 现 有 设计 模式 需要 网 络 管理 员 在 
代理 服务 器 进行 探测 时 为 探测 顺序 分 配 一 定 的 优先 级 。 

当成 员 服务 器 检测 到 瞬时 拥塞 消失 时 ， 所 关联 到 的 所 有 代理 服务 器 子 集会 全 部 解 
散 ， 顺 序 采用 逆序 的 方式 〈 与 开始 探测 时 的 排序 方式 相反 ) 。 执 行 的 步骤 为 : 

1) 服务 器 更 新 DNS 记录 ; 

2) 服务 器 通知 代理 服务 器 解散 ; 

3) 代理 服务 器 改变 自身 模式 ， 从 代理 缓存 服务 器 模式 变 成 代理 服务 器 模式 。 

当 所 有 的 代理 服务 器 解散 后 ， 这 种 类 似 CDN 的 覆盖 网 转换 回 正常 的 C/S 模式 。 
注意 ， 服 务 器 不 是 立刻 解散 的 ， 因 为 低 负载 仅仅 是 暂时 的 ， 因 此 系统 此 时 还 应 处 于 反 
瞬时 拥塞 模式 。 


11.3.5 动态 重组 


每 一 台 代理 服务 器 都 有 自己 的 本 地 监控 系统 ， 可 以 检测 用 户 请 求 率 和 自身 的 整体 
负载 。 覆 盖 中 的 代理 服务 器 无 论 初始 时 就 存在 还 是 后 来 加 入 ， 都 周期 性 发 送 反馈 信息 
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到 服务 器 ， 该 反馈 信息 包括 瞬时 拥塞 对 象 的 请 求 率 和 代理 服务 器 上 的 整体 负载 情况 。 

RARE UE Tu 时 ， 代 理 服务 器 将 服务 器 请 求 率 已 经 逼近 临界 点 并 还 在 增加 的 
情况 上 报 。 当 大 多 数 代理 服务 器 都 上 报 同 样 信息 时 ， 服 务 器 开始 加 入 更 多 的 代理 服务 
合 。 这 些 被 加 入 的 代理 服务 器 处 于 空闲 池 中 ， 并 且 没 有 加 入 任何 覆盖 。 此 时 ， 服 务 器 
对 空闲 的 代理 服务 器 逐个 进行 探测 ， 并 选 出 一 个 开始 使 用 。 随 后 ， 服 务 器 与 这 人 台 代 理 
服务 器 一 同 执行 11. 3. 4 节 中 描述 的 步骤 。 

当 任 意 一 台 代理 服务 器 上 的 负载 低 于 7,,， 并 且 其 他 的 代理 服务 器 未 处 于 高 负载 
情况 时 ， 系 统 将 它们 解散 ， 解 散 的 顺序 与 代理 服务 器 的 加 入 顺序 相反 。 因 为 DNS 的 
传播 需要 花费 较 长 的 时 间 ， 因 此 代理 服务 器 运行 模式 的 改变 要 稍 晚 一 些 。 如 果 在 DNS 
更 新 之 后 客户 端 仍然 连接 到 这 个 代理 服务 器 ， 那 么 该 服务 器 将 充当 通常 的 前 向 代理 服 
务 器 ， 它 将 从 本 地 缓存 中 对 内 容 进行 检索 ， 或 将 用 户 的 请 求 重 定向 到 其 他 成 员 服务 器 
或 覆盖 中 的 任意 一 台 临 时 代理 缓存 服务 器 。 

图 11. 4 给 出 了 服务 器 的 工作 流程 图 、 初 始 和 辅助 代理 服务 器 以 及 网 络 转换 CUL 
11. 3.4 节 ) 和 动态 重组 。 


服务 器 初始 代理 服务 器 辅助 代理 服务 器 
| _ 作 为 正常 工作 代理 作为 正常 代理 服务 器 工作 
| 检测 瞬时 拥塞 | 
— 
| 更 新 DNS 记 录 | 
— 

EEHE S Mee 
— "——e 
| 更 新 DNS 记 录 | 
OP pn cee me 
en a S ERROR 
| 更 新 DNS 记 录 | 
———— —— e" 
TUUS 
| 更 新 DNSjp 录 | 
— 



















反馈 给 服务 器 





作为 正常 代理 服务 器 工作 
图 11.4 FCAN 的 工作 流程 图 


作为 正常 代理 服务 器 工 
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11.3.6 基于 DNS 的 重 定向 


为 了 避免 服务 器 和 网 络 的 过 载 ， 必 须 对 海量 请 求 进行 重 定 向 。 与 单一 站 点 机 制 中 
本 地 负载 均衡 系统 不 同 ， 这 个 重 定向 是 在 大 范围 环境 中 完成 的 ， 其 中 代理 服务 器 之 间 
的 距离 可 能 很 远 。 上 文 已 经 提 及 ， 我 们 使 用 了 基于 DNS 的 请 求 重 定向 技术 。DNS 是 
所 有 互联 网 应 用 中 都 需要 的 设施 ， 在 互联 网 上 无 处 不 在 ， 并 且 对 于 客户 端 来 说 是 透 
明 的 。 

当 一 个 客户 端 试图 通过 本 地 DNS 服务 器 解析 服务 器 域名 时 ， 成 员 服务 器 的 DNS 
输出 的 是 相应 的 成 员 缓存 代理 服务 器 的 地 址 而 非 源 服务 器 的 地 址 。 提 供给 客户 端的 地 
址 可 能 是 通过 某 一 选择 策略 选择 出 来 的 任 一 代理 服务 器 ， 选 择 策略 可 以 是 通过 一 种 简 
单 的 轮 询 方 式 ， 也 可 能 是 以 负载 均衡 方式 或 者 基于 最 近邻 的 方式 。 经 过 重 定向 的 海量 
请 求 由 目标 代理 服务 器 来 进行 处 理 “ 。 

我 们 使 用 一 台 特 殊 配 置 的 DNS 服务 器 (或 者 从 严格 意义 上 说 ，DNS 封装 器 ) ， 称 
为 TENBIN"”“] ， 它 运行 在 服务 器 端 ， 允 许 DNS 中 的 映射 项 被 动态 修改 。TENBIN 是 
我 们 的 一 个 研究 成 果 ， 并 且 已 经 用 于 实际 应 用 ， 如 “Ring Server”” fl “LIVE! 
ECLIPSE"U? , TENBIN 也 支持 用 于 选择 “合适 ”地 址 的 策略 配置 。 该 策略 可 以 基于 
负载 权重 算法 、 最 近邻 的 算法 、 缓 存 本 地 性 的 算法 或 简单 的 轮 询 算 法 。 

一 旦 地 址 被 修改 ,新 地 址 便 通过 互联 网 传递 至 客户 端的 DNS 服务 器 。 一 个 问题 
fi, DNS 缓存 可 能 会 造成 传播 过 程 的 延 时 ， 其 结果 是 用 户 请 求 仍然 需要 发 至 源 服 务 
器 。 为 了 解决 这 个 问题 ， 可 以 设置 DNS 中 的 记录 ， 赋 予 其 一 个 较 短 的 失效 时 间 ， 即 
零 生 存 周期 (zero TTL) 。 我 们 已 通过 TENBIN 的 实验 和 实际 应 用 积累 了 大 量 关 于 DNS 
传播 的 经 验 数据 。 一 般 而 言 ， 完 成 全 球 范围 的 传播 需要 花费 10 ~ 15min 时 间 ， 但 是 与 
可 能 长 达 数 小 时 或 数 天 的 瞬时 拥塞 相 比 ， 这 个 时 间 几 乎 可 以 忽略 不 计 5 。 


11.3.7 基于 仿真 的 性 能 评估 


为 了 对 FCAN 进行 初步 的 验证 和 评估 ， 我 们 建立 了 一 个 基于 线程 的 包含 TCP/ 
UDP 和 应 用 层 的 虚拟 网 络 用 于 仿真 实验 。 我 们 运行 了 若干 实验 ， 分 别 测试 了 不 同类 
型 的 瞬时 拥塞 。 下 面 给 出 其 中 的 一 个 实验 ， 它 提供 了 真实 的 访问 日 志 数 据 ， 该 数据 来 
自 “LIVE! ECLIPSE” 项 目 ” 。 在 2006 年 3 月 29 日 , 从 GMT 时 间 9: 00 到 11: 30, 
该 项 目 从 两 个 不 同 的 服务 器 站 点 分 发 来 自 土耳其 、 利 比 亚 和 埃及 的 日 食 流 信息 。 这 两 
个 站 点 是 : 

e http; //www. live — eclipse. org 

e http: //www. nishoku. jp 

前 者 对 于 全 球 用 户 均 可 访问 ， 后 者 的 主要 访问 者 为 日 本 用 户 。 在 访问 模式 上 两 个 
站 点 有 所 不 同 ， 因 为 前 者 的 平均 访问 率 要 比 Nishoku 站 点 高 得 多 。 图 11.5 给 出 了 两 个 
站 点 在 日 食 发 生 期 间 的 访问 日 志 。 

在 将 数据 送 入 模拟 器 时 ， 站 点 的 日 志 数 据 被 按 比 例 缩小 。 其 中 ，Live - Eclipse 站 
点 的 数据 被 缩小 到 1/30, iij Nishoku 缩小 到 1/10。 在 仿真 中 每 秒 对 应 于 真实 时 间 的 
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Eclipse 访问 (平均 60S) 





0 
0 50 100 150 200 250 0 50 100 150 200 250 
-— 时 间 /s 、、 ”时 间 /s 
访问 www.live-eclipse.org 访问 www.nishoku.jp 
图 11.5 对 两 个 日 食 流 站 点 的 访问 


lmin。 实 验 中 使 用 了 两 台 不 同 的 成 员 服 务 器 : 用 于 Live - Eclipse 的 SVRO1 和 用 于 
Nishoku 的 SVR02。 实 验 中 使 用 了 10 台 成 员 缓 存 代理 服务 器 用 于 缓解 瞬时 拥塞 。 为 这 
些 成 员 服 务 器 设置 的 代理 服务 器 优先 级 〈 即 探测 顺序 ) 是 不 同 的 ， 并 且 代 理 服务 器 
的 初始 子 集合 也 不 相同 ， 这 些 不 同 的 设置 主要 是 根据 成 员 服 务 器 的 优先 级 和 瞬时 拥塞 
的 强度 。 

图 11.6 和 图 11.7 给 出 了 仿真 结果 。 其 中 ， 图 11. 6 给 出 的 是 在 SVROI 周围 产生 
的 服务 于 “Live Eclipse" 的 覆盖 ， 图 11.7 给 出 的 是 对 应 于 “Nishoku” 的 SVR02 # 
盖 。 在 这 两 个 图 中 ， 左 图 显示 的 是 服务 器 的 平均 负载 ， 右 图 是 个 体 负载 。 

在 “Live Eclipse” BPA] 台 代理 服务 器 ， 其 中 两 个 是 初始 代理 服务 器 ， 五 台 
是 辅助 代理 服务 器 ， 如 表 11.1 所 示 。 

表 11.1 Live Eclipse 覆盖 中 的 代理 服务 器 


svioi Rm 
os Cah n 
cm ntt) ai 
om ||. 8 | —— 
as im 
am I 
os in 


在 最 初 的 60s 中 ， 服 务 器 SVR01 单独 处 理 用 户 请 求 。 当 瞬时 拥塞 在 第 60s 左右 到 
达 时 ， 服 务 器 加 入 两 台 代 理 服 务 器 以 缓解 瞬时 拥塞 ， 由 这 两 台 代理 服务 器 和 另外 一 台 
随后 加 入 的 辅助 代理 服务 器 对 负载 进行 处 理 。 在 第 150s 左右 当 负载 的 第 二 个 快速 增 
长 发 生 时 ， 又 有 四 台 代 理 服务 器 被 加 入 。 当 使 用 所 有 的 7 台 代理 服务 器 时 ， 可 以 发 现 
平均 负载 已 经 被 保持 在 了 阔 值 以 下 。 在 第 180s 处 ， 用 户 请 求 数 开 始 下 降 ， 系 统 随 之 
开始 逐步 减少 代理 服务 器 数量 ， 直 到 系统 切换 回 正常 的 C/S 模式 ， 这 一 切换 大 约 在 
第 200s 发 生 。 

在 “Nishoku” 和 覆盖 中 ， 因 为 相对 负载 较 低 ， 所 以 只 加 入 了 两 个 代理 服务 器 ， 即 
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一 台 初 始 代理 服务 器 和 一 台 辅 助 代理 服务 器 ， 如 表 11. 2 所 示 。 
表 11.2 Nishoku 覆盖 中 的 代理 服务 器 





SVRO2 加 入 时 间 离开 时 间 
CPO (初始 ) 48 189 
cp T 


SVRO2 的 瞬时 负载 峰值 在 第 50s 左右 出 现 ， 此 时 已 达到 用 户 请 求 的 峰值 ，CPO 在 
覆盖 中 首先 被 使 用 ， 然 后 CP6 立刻 被 加 入 ,但 仅仅 持续 了 2s。 


50 


—— SVROI 
40 一 -所 有 CP 的 平均 值 


请 求 数量 
请 求 数量 





0 50 100 150 200 250 
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图 11.6 Live Eclipse 覆盖 中 的 负载 缓解 情况 
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B] 11.7  Nishoku 覆盖 中 的 负载 缓解 情况 


11.3.8 结论 


FCAN 最 突出 的 特性 在 于 它 的 动态 性 、 自 适应 组 织 能 力 以 及 类 似 于 CDN 覆盖 的 重 
组 特性 ， 据 我 们 所 知 ， 目 前 尚 没有 其 他 工作 具备 这 些 特 性 。 我 们 提供 的 相关 数据 显示 
了 FCAN 的 这 些 特性 所 带 来 的 功效 。 与 基于 客户 端 层 的 解决 方案 相 比 ， 使 用 缓存 代理 
服务 器 的 中 间 层 解决 方案 更 易于 管理 和 控制 。 另 外 ， 与 基于 服务 器 层 的 解决 方案 相 
比 ，FCAN 更 灵活 ， 也 更 贴近 用 户 。 
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现 有 的 FCAN 设计 仅仅 是 第 一 版 ， 因 此 它 仍 有 很 多 需要 改进 之 处 。 基于 阔 值 的 瞬 
时 拥塞 检测 方法 会 变 得 更 复杂 些 ， 这 一 点 将 在 后 文 提 及 。 基 于 优先 级 的 代理 服务 器 分 
组 机 制 现 在 正在 被 一 种 自治 的 非 中 心 化 聚 类 法 取代 。 

另外 一 个 要 点 是 重 定向 的 粗 粒 度 问 题 。 瞬 时 拥塞 是 面向 对 象 的 ， 而 基于 DNS 的 
重 定向 是 面向 主机 的 ， 因 为 DNS 仅仅 处 理 主机 名 。 因 此 ， 较 为 可 行 的 做 法 是 仅 把 瞬 
时 拥塞 的 对 象 定向 到 代理 服务 器 覆盖 ， 而 其 他 针对 非 退 时 拥塞 对 象 的 请 求 则 像 正常 情 
况 一 样 直接 处 理 。 基 于 HTTP 的 重 定向 和 URL 静态 化 技术 也 提供 了 精细 粒度 的 面向 
对 象 的 重 定 向 ， 但 是 这 些 方法 对 用 户 并 不 透明 。 

目前 为 止 ， 本 章 所 设计 的 初步 仿真 并 不 包括 对 FCAN 的 定量 分 析 和 全 面 评 估 。 在 
互联 网 真实 环境 中 ，FCAN 应 当 由 如 下 部 分 组 成 : 

1) 一 台 专 用 的 Web 服务 器 。 该 服务 器 配备 一 个 实现 FCAN 功能 的 封装 器 模块 ， 
其 核心 可 以 是 Apache， 封 装 器 应 当 拦 截 前 往 核 心服 务 器 的 请 求 。 

2) 一 台 专 用 的 缓存 代理 服务 器 。 该 代理 服务 器 配备 一 个 实现 FCAN 功能 的 封装 
器 模块 。 其 核心 可 以 是 Squid， 封 装 器 应 当 拦截 前 往 核 心 代理 服务 器 的 请 求 。 

3) 一 台 增 强 的 DNS 服务 器 。TENBIN 是 一 个 很 好 的 选择 ， 事 实 上 TENBIN 已 经 
得 到 了 实际 应 用 。 

FCAN 最 初 的 设计 目标 是 提供 瞬时 拥塞 情况 下 的 保护 ， 但 事实 上 它 的 用 途 并 不 仅 
限于 此 。 在 任何 突 发 的 流量 激增 时 ， 它 可 以 在 预定 阐 值 下 对 服务 器 负载 进行 调整 ， 因 
此 它 也 能 应 对 某 些 DDoS 攻击 。 


11.4 写 给 使 用 者 


#11.3 总结 了 若干 相关 研究 的 重要 成 果 (它们 中 的 大 多 数 已 经 在 本 章 中 提 及 ) ， 
并 把 它们 和 FCAN 进行 了 比较 ， 我 们 的 结论 如 下 : 


表 11.3 相关 系统 应 用 的 设计 汇总 表 






服务 器 层 
代理 服务 器 层 
客户 端 层 








代理 缓存 服务 器 









客户 端 透明 度 






客户 端 重 定向 






镜像 副本 v 
按 需 缓存 v wv V v v 





副本 放置 
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( 续 ) 
设计 问题 pp | os {we | as | co | cp | 


基于 于 P2P 
非 结构 化 的 P2P 


缓存 缺失 避免 





iE: DD: 带 有 动态 委托 的 CDN, ML: 多 层 缓 存 ，BS: BackSlash，DS: Dot Slash, CO; CoralCDN, 
CP; CoopNet, PF; PROOFS, FC; FCAN。 


1) 基于 需求 峰值 的 过 度 配置 或 者 使 用 CDN 来 预先 提高 服务 器 定位 的 方法 代价 高 
昂 且 低 效 。 

2) 客户 端的 P2P 覆盖 可 以 很 好 地 解决 瞬时 拥塞 问题 ,但 是 解决 得 并 不 完美 ， 因 
为 它 失 去 了 对 客户 端的 透明 性 和 可 控 性 。 

3) 另外 ， 某 些 PP 系统 也 面临 流量 超 限 等 问题 ， 这 些 问题 在 瞬时 拥塞 消失 时 不 
能 忽略 。 

4) 中 间 层 解决 方案 相对 其 他 解决 方案 而 言 具 有 一 定 优 势 ， 这 是 因为 缓存 技术 在 
解决 目标 对 象 为 静态 且 尺 寸 较 小 的 瞬时 拥塞 问题 时 非常 有 效 。 

5) 大 多 数 中 间 层 解决 方案 忽视 了 一 个 问题 ， 即 60% 的 对 象 在 瞬时 拥塞 开始 时 并 
没有 被 缓存 ， 这 导致 源 服务 器 会 面临 大 量 缓存 缺失 的 风险 。 

6) 相对 于 服务 器 ， 前 向 代理 服务 器 更 适合 被 部 署 为 代理 缓存 服务 器 。 代 理 服务 
器 离 用 户 更 近 ， 因 此 对 改善 用 户 响应 时 间 和 网 络 拥塞 更 有 效 。 

7) 为 了 灵活 和 高 效 地 处 理 瞬 时 拥塞 问题 ， 自 适应 的 转换 技术 必 不 可 少 ， 该 技术 
能 够 随时 根据 需要 组 织 潜在 资源 ， 而 不 是 一 直 占 据 它 们 。 

总 体 而 言 ， 现 有 研究 成 果 都 各 具 优 缺点 。 通 过 比较 ， 我 们 得 出 的 结论 是 ， 目 前 仍 
然 缺少 一 种 高 效 的 方法 来 以 透明 的 方式 灵活 、 可 靠 和 高 效 地 解决 瞬时 拥塞 问题 。 


11.5 未 来 研究 方向 


虽然 目前 在 缓解 瞬时 拥塞 方面 有 很 多 问题 需要 解决 ， 但 我 们 将 重点 关注 以 下 两 个 问题 。 

(1) 瞬时 拥塞 的 早期 检测 

我 们 已 经 注意 到 一 种 现象 ， 即 在 瞬时 拥塞 到 达 服 务 器 之 前 很 短 一 段 时 间 内 ， 大 量 
请 求 有 时 会 涌 向 DNS 服务 器 去 解析 服务 器 域名 。 这 表明 ， 如 果 有 一 种 技术 能 够 从 分 
布 于 各 处 的 DNS 服务 器 上 收集 到 请 求 的 数量 并 进行 分 析 ， 就 可 以 预测 到 瞬时 拥塞 的 
来 临 ， 并 能 够 对 目标 服务 器 发 出 早期 预警 信号 

(2) 处 理 动态 对 象 

对 于 所 有 的 CDN 系统 而 言 ， 实 现 动 态 对 象 的 发 布 必须 是 一 项 基本 功能 。 动 态 对 
象 可 分 为 以 下 两 类 : 

1) 动态 生成 的 内 容 (大 多 数 使 用 脚本 代码 和 后 端 数据 库 ) ; 
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2) 频繁 更 新 的 内 容 (常见 于 新 闻 网 站 )。 

最 简单 的 方法 就 是 在 过 载 情况 下 将 动态 对 象 用 修改 过 的 静态 版 本 替换 ， 其 代价 是 
牺牲 了 服务 质量 "。 

如 果 后 端 数据 库 是 只 读 的 ， 那么 处 理 第 一 种 动态 对 象 一 定 会 相对 容易 。 如 果 后 端 
数据 库 并 非 只 读 或 者 动态 对 象 属于 第 二 类 ， 那 么 就 必须 提供 一 种 快速 和 可 靠 的 机 制 来 
同步 地 更 新 所 有 副本 。 这 个 保证 更 新 同步 化 和 一 致 性 的 问题 已 经 在 分 布 式 数据 库 领 
域 、 分 布 式 缓存 和 分 布 式 共享 内 存 等 领域 中 进行 了 广泛 和 深入 的 研究 ， 其 研究 成 果 均 
可 应 用 于 本 章 所 讨论 的 问题 中 。 

最 后 ， 一 些 集成 了 服务 器 层 、 中 间 层 和 客户 端 层 的 综合 解决 方案 也 有 一 定 的 发 展 
前 途 ， 值 得 引起 读者 和 相关 研究 人 员 的 关注 。 


11.6 总 结 


短 时 互联 网 拥塞 ( 即 瞬时 拥塞 问题 ) 对 于 设计 可 扩展 和 高 效 的 分 布 式 服务 器 系 
统 提出 了 新 的 挑战 。 本 章 分 析 了 瞬时 拥塞 的 主要 特性 ， 针 对 相关 研究 方向 进行 了 介 
绍 ， 并 指出 了 处 理 短 时 互联 网 拥塞 的 动态 网 络 的 必要 性 。 我 们 原创 性 地 提出 了 一 种 新 、 
型 的 动态 CDN， 能 够 使 自身 网 络 架构 在 C/S 和 CDN 之 间 进 行 自 适应 优化 ， 由 此 减轻 
瞬时 拥塞 带 来 的 影响 。 

仿真 结果 表明 ，FCAN 能 够 为 瞬时 拥塞 的 早期 检测 提供 良好 的 基础 ， 并 能 够 处 理 
动态 对 象 。 因 此 ， 我 们 的 结论 是 : FCAN 能 够 为 高 效 处 理 瞬时 拥塞 问题 提供 一 ent 
网 络 划 新 的 重要 思路 。 


致谢 


本 章 内 容 来 自 Kyushu Sangyo 大 学 的 Toshihiko Shimokawa 教授 、 中 国 的 Chenyu Pan 
B., EZAK Merdan Atajanov 博士 的 合作 ， 同 时 本 章 作 者 也 对 Kate Miller 女士 
的 校对 工作 表示 感谢 。 


参考 文献 


[1] Abdelzaher TF, Bhatti N (1999) Web Server QoS Management by Adaptive Content Delivery. 
In: Computer Networks, 31(11-16):1563-1577 

[2] Adler S (1999) The Slashdot Effect, an Analysis of Three Internet Publications. 
http://ssadler.phy.bnl.gov/adler/SDE/SlashDotEffect.html 

[3] Akamai Technologies Inc. http://www.akamai.com 

[4] Ari I, Hong B, Miller EL, Brandt SA, Long DE (2003) Managing Flash Crowds on the Internet. 
In: Proc. 11th IEEE/ACM Int. Symp. on Modeling, Analysis, and Simulation of Comp. and 
Telecomm. Sys., 246-249 

[5] Arlitt M, Cherkasova L, Dilley J, Friedrich R, Jin T (1999) Evaluating Content Management 
Techniques for Web Proxy Caches. In: ACM SIGMETRICS Performance Evaluation Review, 
27(4):3-11 

[6] Arlitt M, Jin T (2000) A Workload Characterization of the 1998 World Cup Web Site. In: 
IEEE Network, 14(3):30-37 


236 内 容 分 发 网 络 





[7] Atajanov M, Shimokawa T, Yoshida N (2007) Autonomic Multi-Server Distribution in Flash 
Crowds Alleviation Network. In: Proc. IFIP 3rd Int. Symp. on Network Centric Ubiquitous 
Systems (LNCS 4809, Springer), 309-320 

[8] Barford P, Plonka D (2001) Characteristics of Network Traffic Flow Anomalies. In: Proc. 
ACM SIGCOMM Internet Measurement Workshop, 69-73 

[9] BitTorrent Website. http://www.bittorrent.com/ 

[10] Breslau L, Cue P, Fan L, Phillips G, Shenker S (1999) Web Caching and Zipf-like Distribu- 
tions: Evidence and Implications. In: Proc INFOCOM 1999, 126-134 

[11] CERT (1996) TCP SYN Flooding and IP Spoofing Attacks. Advisory CA-1996-21, 
http://www.cert.org/advisories/CA-1996-21.html 

[12] CERT (1999) Denial of Service Attacks. http://www.cert.org/tech_tips/denial_of_service.html 

[13] Chandra A, Shenoy P (2003) Effectiveness of Dynamic Resource Allocation for Handling 
Internet Flash Crowds. Tech. Report, TRO3-37, Dept. of Computer Science, Univ. of Mas- 
sachusetts Amherst 

[14] Chen X, Heidemann J (2002) Flash Crowd Mitigation via an Adaptive Admission Control 
Based on Application-Level Measurement. Tech. Report, ISI-TR-557, USC/ISI 

[15] Cherkasova L, Phaal P (2002) Session-Based Admission Control: A Mechanism for Peak 
Load Management of Commercial Web Sites. In: IEEE Trans. on Computers, 51(6):669—685 

[16] Foster I, Kesselman C, Tuecke S (2001) The Anatomy of the Grid: Enabling Scalable Virt:al 
Organizations. In: Int. J. of High Performance Computing Applications, 15(3):200-222 

[17] Freedman MJ, Freudenthal E, Mazieres D (2004) Democratizing Content Publication with 
Coral. In: Proc. 1st USENIX/ACM Symp. on Networked Systems Design and Implementation 

[18] Houle KJ, Weaver GM, Long N, Thomas R (2001) Trends in Denial of Service Attack 
Technology. CERT Coordination Center White Paper, http://www.cert.org/archive/pdf/DoS 
trends.pdf 

[19] Iyengar AK, Squillante MS, Zhang L (1999) Analysis and Characterization of Large-Scale 
Web Server Access Patterns and Performance. In: World Wide Web, 2(1—2):85-100 

[20] Joubert P, King R, Neves R, Russinovich M, Tracey J (2001) High-Performance Memory- 
Based Web Servers: Kernel and User-Space Performance. In: Proc. USENIX 2001, 175-188 

[21] Jung J, Krishnamurthy B, Rabinovich M (2002) Flash Crowds and Denial of Service Attacks: 
Characterization and Implications for CDNs and Web Sites. In: Proc. 11th Int. World Wide 
Web Conf., 252-262 

[22] Kandula S, Katabi D, Jacob M, Berger A (2005) Botz-4-Sale: Surviving Organized DDoS 
Attacks That Mimic Flash Crowds. In: Proc. USENIX 2nd Symp. on Networked Systems 
Design and Implementation, 287—300 

[23] Kong K, Ghosal D (1999) Mitigating Server-Side Congestion in the Internet through Pseu- 
doserving. In: IEEE/ACM Trans. on Networking, 7(4):530—544 

[24] LeFebvre W (2002) CNN.com: Facing a World Crisis. In: USENIX Annual Tech. Conf., 
http://tcsa.org/lisa200 1/cnn.txt 

[25] LimeLight Networks. http://www.limelightnetworks.com/ 

[26] LIVE! ECLIPSE. http://www.live-eclipse.org/index_e.html 

[27] Lorenz S (2000) Is Your Web Site Ready for the Flash Crowd? In: Sun Server Magazine 
2000/11, http://www.westwindcos.com/pdf/sunserver. 1 1900.pdf 

[28] Lyer S, Rowstron A, Druschel P (200) Squirrel: A Decentralized Peer-to-Peer Web Cache. In: 
Proc. 21th ACM Symp. on Principles of Distributed Comp., 213-222 

[29] Moore D (2001) The Spread of the Code-Red Worm (CRv2). http://www.caida.org/analysis/ 
security/code-red/coderedv2_analysis.xml 

[30] Nah F (2004) A Study on Tolerable Waiting Time: How Long Are Web Users Willing to Wait? 
In: Behaviour and Information Technology, 23(3):153-163 

[31] Niven L (1973) Flash Crowd. In: The Flight of the Horse, Ballantine Books, 99-164 

[32] Padmanabhan VN, Sripanidkulchai K. (2002) The Case for Cooperative Networking. In: Proc. 
Ist Int. Workshop on Peer-to-Peer Systems, 178-190 

[33] Pan C, Atajanov M, Hossain MB, Shimokawa T, Yoshida N (2006) FCAN: Flash Crowds 
Alleviation Network Using Adaptive P2P Overlay of Cache Proxies. In: IEICE Trans. on 
Communications, E89-B(4):1119-1126 


第 11 章 ”缓解 瞬时 拥塞 的 动态 CDN 





[34] Pan C (2006) Studies on Adaptive Network for Flash Crowds Alleviation. Ph. D. Thesis, 
Saitama University 

[35] Park K, Lee H (2001) On the Effectiveness of Route-Based Packet Filtering for Dis- 
tributed DoS Attack Prevention in Power-Law Internets. In: Proc. ACM SIGCOMM 2001, 
15-26 

[36] Ratnasamy S, Francis P, Handley M, Karp R, Shenker S (2001) A Scalable Content- 
Addressable Network. In: Proc. ACM SIGCOMM 2001, 161-172 

[37] The Ring Server Project. http://ring.aist.go.jp/index.html.en 

[38] Rowstron A, Druschel P (2001) Storage Management and Caching in PAST, A Large-scale, 
Persistent Peer-to-peer Storage Utility. In: Proc. ACM 18th Symp. on Operating Systems Prin- 
ciples, 188—201 

[39] Rubenstein D, Sahu S (2001) An Analysis of a Simple P2P Protocol for Flash Crowd Docu- 
ment Retrieval. Tech.Report, EE011109-1, Columbia Univ. 

[40] Saroiu S (2001) Bottleneck Bandwidths. http://www.cs.washington.edu/homes/tzoompy/ 
sprobe/webb.htm 

[41] Shimokawa T, Yoshida N, Ushijima K (2000) Flexible Server Selection Using DNS. In: Proc. 
Int.Workshop on Internet 2000, in conjunction with IEEE-CS 20th Int. Conf. on Distributed 
Computing Systems, A76-A81 

[42] Shimokawa T, Yoshida N, Ushijima K (2006) Server Selection Mechanism with Pluggable 
Selection Policies. In: Electronics and Communications in Japan, III, 89(8):53-61 

[43] Sivasubramanian S, Szymaniak M, Pierre G, Steen M (2004) Replication for Web Hosting 
Systems. In: ACM Comp. Surveys, 36(3):291-334 

[44] Stading T, Maniatis P, Baker M (2002) Peer-to-peer Caching Schemes to Address Flash 
Crowds. In: Proc. 1st Int. Workshop on Peer-to-Peer Systems, 203-213 

[45] Stavrou A, Rubenstein D, Sahu S (2004) A Lightweight, Robust P2P System to Handle Flash 
Crowds, In: IEEE J. on Selected Areas in Comm., 22(1):6-17 

[46] Stoica I, Morris R, Karger D, Kaashoek F, Balakrishnan H (2001) Chord: A Scalable 
Peer-to-Peer Lookup Service for Internet Applications. In: Proc. ACM SIGCOMM 2001, 
149-160 

[47] Wang J (1999) A Survey of Web Caching Schemes for the Internet. In: ACM Comp. Comm. 
Review, 29(5):36-46 

[48] Wang L, Pai V, Peterson L (2002) The Effectiveness of Request Redirection on CDN Robust- 
ness. In: ACM Operating Systems Review, 36(SI):345-360 

[49] Welsh M, Culler D (2003) Adaptive Overload Control for Busy Internet Servers. In: Proc. 
USENIX Conf. on Internet Technologies and Systems 

[50] Zao W, Schulzrinne H (2004) DotSlash: A Self-Configuring and Scalable Rescue System for 
Handling Web Hotspots Effectively. In: Proc. Int. Workshop on Web Caching and Content 
Distribution, 1-18 

[51] Zona Research, Inc.(1999) The Economic Impacts of Unacceptable Web-Site Download 
Speeds. White Paper, http://www.webperf.net/info/wp_downloadspeed. pdf 


237 


第 12 章 基于 CDN 的 协作 流 媒体 服务 


Giancarlo Fortino, Carlo Mastroianni 和 Wilma Russo 
12.1 引言 


近年 来 ， 内 容 分 发 网 (CDN) 已 经 成 为 了 一 种 互联 网 流 媒体 服务 的 高 效 解 决 方 
R, 从 TV 广播 到 视频 点 播 其 应 用 遍布 互联 网 "。 然 而 ,现代 多 媒体 应 用 并 不 仅仅 是 
提供 内 容 的 检索 或 访问 ， 还 包括 内 容 的 创建 、 修 改 和 管理 ， 并 能 够 主动 地 寻找 合适 地 
点 来 放置 内 容 ， 借 此 提供 新 的 增值 服务 。 

CDN 可 以 有 效 地 用 于 支持 协作 流 媒体 服务 ， 特 别 适用 于 协作 播放 服务 “”， 该 服 
务 能 够 使 一 组 客户 端 以 某 种 共享 的 方式 来 请 求 、 观 看 流 媒体 和 控制 流 媒 体 的 会 话 。 

本 章 介绍 了 一 种 基于 CDN 的 网 络 架 构 ， 能 够 支持 协作 式 的 播放 服务 。 从 流 媒 体 
的 分 发 和 控制 而 言 ， 该 服务 能 够 显著 提升 那些 支持 协作 播放 服务 的 中 心 化 架构 的 性 
能 。 具 体 而 言 ， 本 章 提 出 了 一 种 称 为 分 层 式 合作 控制 协议 (HCOCOP) 的 服务 架构 ， 
能 够 控制 在 CDN 支持 下 的 协作 播放 服务 会 话 中 共享 的 流 媒 体 。 在 对 协作 播放 会 话 进 
行 设置 时 ，HCOCOP 被 映射 到 分 层 控 制 结 构 中 ， 该 结构 由 基于 CDN 的 架构 组 成 并 提 
供 支 持 ， 分 层 结构 由 一 台 位 于 底层 的 协作 服务 器 、 一 台 或 多 台 位 于 中 间 层 的 控制 服务 
器 以 及 位 于 叶 节 点 层 的 客户 端 组 成 。 

HCOCOP 通过 离散 时 间 仿 真 来 进行 实现 和 性 能 评估 。 具 体 而 言 ， 性 能 评估 环节 
(包括 对 称 和 非 对 称 的 控制 结构 拓扑 ) 以 及 三 种 不 同 的 HCOCOP 架构 (NoCoop Lo- 
calCoop 和 GlobalCoop) 能 够 针对 阻止 概率 和 拒绝 概率 这 两 个 性 能 指标 进行 分 析 ， 而 
这 两 个 指标 具体 表征 了 HCOCOP 的 性 能 。 

本 章 余下 内 容 组 织 如 下 : 首先 描述 提供 协作 播放 服务 的 架构 ; 然后 介绍 一 种 理论 
上 的 CDN， 称 为 COMODIN; 12.4 节 和 12.5 节 分 别 给 出 对 HCOCOP 的 描述 和 性 能 评 
fh; 在 12.6 节 ， 描 述 了 基于 CDN 协作 播放 服务 系统 的 两 个 应 用 领域 ; 12.7 节 给 出 未 
来 的 研究 方向 ; 在 最 后 一 节 中 ， 对 本 章 要 点 进行 总 结 。 


12.2 ”背景 知识 和 相关 工作 


协作 播放 服务 使 得 明确 组 成 的 同步 用 户 组 能 够 选择 、 观 看 并 协作 地 控制 一 个 远程 
的 媒体 播放 。 通 过 该 服务 支持 的 会 话 被 称 为 协作 播放 会 话 (CPS) 5, 

特别 而 言 ， 一 个 CPS 包括 三 个 紧密 相关 的 会 话 : 

(1) 多 媒体 会 话 

一 个 以 录制 的 音频 /视频 报告 文件 〈 如 一 次 讨论 组 会 ) ， 或 一 部 电影 ， 或 者 某 个 
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更 复杂 的 合成 多 媒体 对 象 的 形式 呈现 的 媒体 播放 功能 被 同步 传递 给 组 内 所 有 成 员 ， 人 允 
许 所 有 成 员 观 看 。 

(2) 控制 会 话 

媒体 播放 由 VCR 的 典型 指令 控制 (如 播放 、 和 暂停 、 拖 动 等 )， 因 此 组 内 任意 成 员 
都 能 够 改变 多 媒体 会 话 的 状态 。 

(3) 交互 会 话 

组 成 员 可 以 彼此 交换 有 关 组 建 和 共享 媒体 播放 的 相关 知识 。 

一 个 支持 协作 播放 服务 的 架构 需要 以 下 核心 服务 来 组 织 和 运行 CPS: 

(1) 组 的 形成 和 管理 (GFM) 

GFM 服务 支持 协作 组 的 形成 和 管理 。 具 体 而 言 ， 一 个 组 将 围绕 着 由 CPS 组 管理 
员 和 受 邀 用 户 的 注册 所 决定 的 媒体 对 象 的 选择 结果 来 形成 。 

(2) 流 媒体 (MS) 

流 媒体 服务 支持 从 一 个 选 定 的 媒体 文件 对 象 到 所 有 组 成 员 的 基于 流 的 分 发 。 

(3) 控制 流 (SC) 

控制 流 服务 允许 组 成 员 来 控制 那些 流 媒 体 支持 的 多 媒体 会 话 。 

(4) 组 交互 (GI) 

组 交互 服务 通过 基于 文本 的 报 文 方式 支持 组 成 员 之 间 的 信息 交换 。 

具体 而 言 ，SC 服务 基于 播放 控制 协议 ， 该 协议 允许 通过 发 送 类 似 于 VCR 的 控制 
指令 ， 并 负责 在 控制 指令 影响 CPS 时 处 理 CPS 状态 的 改变 。 为 了 监督 组 成 员 在 发 送 
控制 指令 时 的 行为 ， 流 控制 协议 必须 使 用 合作 机 制 。 这 些 合作 机 制 能 够 决定 组 中 哪个 
成 员 有 权 发 送 控制 指令 〈 在 基于 底层 的 合作 时 ) 或 哪 一 条 传输 控制 指令 被 接受 (在 
基于 随机 的 合作 机 制 时 5] ) 。 基 于 底层 的 合作 依赖 于 令 牌 环 的 概念 ， 该 令 牌 环 必 须 被 
一 个 组 成 员 明 确 获 取 ， 用 于 发 送 控制 指令 。 相 反 ， 在 基于 随机 的 合作 方式 中 ， 每 一 个 
组 成 员 都 可 以 在 无 需 请 求 底层 的 情况 下 发 送 控制 指令 ， 因 此 被 不 同 组 成 员 同时 发 送 的 
控制 指令 之 间 会 出 现 冲突 。 所 以 ， 系 统 需要 决定 应 该 接受 哪个 指令 。 

另外 ， 对 CPS 状态 变化 的 控制 也 是 一 个 关键 操作 ， 因 为 它 涉及 对 播放 状态 的 修 
改 和 将 此 修改 信息 向 所 有 的 组 用 户 持续 传输 。 

为 了 描述 CPS 控制 处 理 机 制 和 状态 改变 处 理 机 制 ， 我 们 使 用 了 图 12. 1 中 的 简明 
星 形 架 构 作为 参考 。 图 中 组 件 分 别 为 : 四 媒体 流 和 控制 服务 器 ( MCS) ， 负 责 集成 流 
媒体 服务 MS 和 流 控制 服务 SC; @ 组 播 通信 信道 (MCC) ， 支 持 流 媒体 和 控制 指令 的 
传输 ;@ 协 作客 户 端 (CC) ， 负 责 同一 组 内 成 员 之 间 的 协作 。CPS 的 播放 状态 由 MCS 
管理 ， 当 收 到 控制 指令 后 CPS 状态 发 生 改 变 。 播 放 状态 的 自动 机 如 图 12.2 所 示 ， 包 
括 两 个 状态 (播放 和 和 暂停) 和 相关 控制 指令 标记 出 来 的 状态 转移 (播放 、 拖 动 、 暂 
停 、 停 止 ) 。 协 作客 户 端 也 包含 一 个 相同 形式 的 自动 机 镜像 ， 在 MCS 的 自动 机 状态 发 
后 改变 时 镜像 也 同步 进行 改变 。 因 此 ， 当 MCS 改变 了 播放 状态 自动 机 时 ， 它 将 发 送 
一 条 更 新 报 文 给 所 有 客户 端 ， 从 而 使 得 它们 能 够 相应 改变 自身 的 自动 机 。 在 此 更 新 过 
程 中 ，MCS 不 考虑 其 他 的 控制 指令 。 

为 了 举例 说 明 MCS 和 CC 之 间 的 交互 关系 ， 我 们 使 用 图 12. 3 中 所 示 的 时 序 图 ， 
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在 图 中 假定 协作 机 制 是 随机 的 。 我 们 主要 考虑 三 种 情形 : 





一 一 一 > 控制 


图 12.1 作为 参考 的 星 形 简 要 架构 图 12.2 CPS 播放 状态 的 自动 机 





ATproc = 改变 播放 状态 的 处 理 时 间 X 丢弃 命令 2 


ATupa = 改变 CPS 状 态 的 更 新 时 间 
a) b) 





O 命令 1 和 命令 2 之 间 的 冲突 
c) 


图 12.3 MCS 和 两 台 CC 之 间 交 互 的 时 序 图 
a) 没有 冲突 b) 没有 冲突 及 丢弃 指令 c) 有 冲突 
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1) 无 冲突 情况 ， 其 中 CC, 发 送 控制 指令 。 

2) 无 冲突 情况 并 且 指 令 丢 弃 ， 其 中 CC, 发 送 指令 1，CC, 在 指令 1 发 送 后 再 发 送 
指令 2。 

3) 有 冲突 情况 ，CC, 和 CC, 都 同时 地 发 送 控制 指令 。 

在 第 一 种 情况 中 ，CC, 发 送 一 条 控制 指令 ，MCS 在 收 到 指令 后 对 其 进行 处 理 ， 改 
变 播放 状态 ， 并 将 更 新 信息 传递 给 所 有 的 协作 客户 端 。 

在 第 二 种 情况 中 ，MCS 在 控制 指令 处 理 和 CPS 状态 更 新 两 个 过 程 中 拒绝 任何 其 
他 控制 指令 。 

在 第 三 种 情况 中 ，CC, 和 CC, 发 送 的 控制 指令 在 同一 时 间 抵 达 MCS, Alte MCS 
必须 决定 哪 一 条 控制 指令 需要 接受 ， 并 同时 丢弃 另外 一 条 。 之 后 ，MCS 按 第 一 种 情 
况 进 行 操作 。 

目前 ， 已 出 现 一 些 系统 设计 和 实现 CPS 的 功能 ， 它 们 的 架构 可 以 分 为 基于 星 形 
的 结构 (如 上 文 所 述 ) 和 基于 CDN 的 结构 。 

MBone VCR 444°. MASH Rover/? 和 ViCRO5I 等 系统 依赖 于 星 形 架构 ， 其 中 一 
台中 心服 务 器 负责 整个 组 的 组 织 、 基 于 IP 组 播 的 流 媒体 传输 和 流 控 制 。 具 体 而 言 ， 
流 媒 体 传输 基于 IP 组 播 并 面向 所 有 系统 。 流 媒体 控制 使 用 IP 单 播 的 仅 为 MBone VCR 
点 播 系统 ， 而 其 他 两 个 系统 用 的 则 是 卫 组 播 。 集 成 在 这 些 系统 上 的 流 控 制 协议 使 用 
随机 协作 机 制 ， 通 过 接受 首 条 输入 控制 指令 并 丢弃 其 余 控 制 指令 的 方式 来 解决 冲突 问 
题 。 以 上 提 到 的 系统 会 遇 到 两 个 主要 问题 : 中 心服 务 器 的 性 能 瓶颈 ， 以 及 了 王 组 播 稀 
玖 可 用 性 导致 的 难以 部 署 的 问题 。 

另外 ， 最近 出 现 了 一 种 新 的 基于 星 形 架 构 的 流 控制 协议 ， 称 为 协作 控制 协议 
( COCOP) 9 , COCOP 依赖 于 与 上 述 系统 相似 的 随机 机 制 ， 但 是 它 也 使 用 了 另 一 种 协 
作 机 制 ， 即 一 个 组 成 员 在 得 知 其 他 成 员 已 发 送 控制 指令 后 ， 会 避免 再 向 系统 发 送 任何 
控制 指令 。Fortino 等 人 "已 经 证 明 ， 使 用 这 种 协作 方法 能 够 提升 系统 的 整体 性 能 。 

COMODIN 系统 中 提供 了 与 星 形 系统 相同 的 功能 ,但 是 它 是 基于 CDN 架构 的 ， 该 
方法 不 仅 克服 了 上 述 系 统 的 问题 ， 并 且 同 原 有 系统 相 比 ， 能 够 增加 流 媒 体 控 制 的 
效率 。 


12.3 COMODIN 系统 概览 


本 节 将 对 COMODIN 系统 进行 简要 介绍 。COMODIN 系统 的 架构 由 两 个 平面 组 成 
( 见 图 12.4) ， 一 个 是 包含 提供 媒体 点 播 流 服务 的 流 CDN (SCDN) 的 基 平 面 ， 另 一 个 
是 提供 协作 播放 服务 的 协作 平面 。 

基 平 面包 括 以 下 基本 网 络 组 件 : 

1) 源 服务 器 ， 它 存储 了 需要 通过 CDN 发 布 的 媒体 对 象 。 

2) 代理 缓存 服务 器 (surrogate) ， 它 是 源 服务 器 内 容 的 部 分 副本 ， 具 有 短期 地 存 
储 内 容 以 及 通过 接 人 网 将 内 容 使 用 流 媒体 服务 器 组 件 分 发 给 用 户 的 能 力 。 

3) 客户 端 ， 它 是 一 个 向 CDN 请 求 特定 内 容 的 多 媒体 应 用 。 
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图 12.4 COMODIN 架构 


4) 重 定向 器 ， 负 责 基 于 重 定向 算法 为 每 一 个 不 同 的 客户 端 请 求 选择 最 合适 的 代 
理 缓存 服务 器 。 

5) 内 容 管理 器 ， 负 责 在 代理 缓存 服务 器 和 源 服 务 器 之 间 实 现 媒体 内 容 的 协作 
存储 。 

协作 平面 负责 提供 协作 播放 服务 ， 由 以 下 网 络 组 件 构 成 : 

1) 协作 播放 会 话 管理 器 (CPSM) ， 基 于 协作 播放 会 话 管理 协议 (CMP) 提供 组 
的 构建 和 管理 核心 服务 。 具 体 而 言 ，CPSM 允许 协作 播放 会 话 (CPS) 的 形成 、 注 册 / 
注销 、 初 始 化 、 加 入 /离开 和 结束 等 。 

2) 协作 播放 控制 服务 器 (CPCS) ， 同 基 平 面 上 的 MSS 集成 在 一 起 ， 支 持 被 一 个 
CPS 内 的 所 有 成 员 所 共享 的 流 媒 体 的 远程 控制 。 

3) CPCS 协作 信道 (CCC)， 能 够 通过 协作 信道 协议 (CCP) 实现 同一 个 CPS 的 
所 有 分 布 式 CPCS 之 间 的 协作 。 

4) 协作 客户 端 (CC)， 本 质 上 是 基 平 面 上 客户 端 组 件 的 增强 版 ,充当 协作 播放 
服务 与 用 户 之 间 的 对 接 。 

一 个 由 COMODIN 架构 支持 的 CPS 可 通过 以 下 步骤 来 建立 并 运行 : 

1) 组 织 。 一 个 组 织 者 CC 与 CPSM 相连 ， 并 请 求 建立 一 个 CPS, 

2) 邀请 。 组 织 者 CC 邀请 其 他 CC 加 入 ， 并 通过 直接 报 文 来 注册 组 织 好 的 CPS, 

3) 注册 。 受 邀 CC 与 CPSM 建立 连接 ， 并 在 CPS 上 进行 注册 。 

4) 初始 化 。 组 织 者 CC 与 CPSM 建立 连接 ， 请 求 对 CPS 的 初始 化 ， 并 将 报 文 重 
定向 到 CPCS, 

5) WMA. CC 通过 注册 的 方式 成 为 CPS 的 成 员 ， 报 文 被 重 定 向 给 各 自 的 CPCS, 

6) 执行 。 任 意 成 员 发 送 播放 控制 请 求 来 启动 CPS, — 4S CPS 的 状态 通过 一 系列 
相继 的 控制 请 求 〈 暂 停 、 播 放 、 拖 动 ) 改变 。 从 控制 角度 而 言 ， 这 一 步 是 通过 下 一 
节 所 述 的 HCOCOP 来 操作 。 

7) 终止 。CPS 可 通过 投票 机 制 被 组 织 者 CC 终结 。 
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图 12.5 给 出 了 一 个 CPS 的 例子 。 该 CPS 由 COMODIN 系统 和 4 个 用 户 组 成 ， 每 
两 个 用 户 连 接 到 一 个 不 同 的 CPCS (CPCS A 或 CPCS B)， 从 而 分 别 组 成 两 个 小 组 (A 
fll B). 


ps 人 下 Ee E 
CC? ees e CC; ce co; 











A 3d cc cc? 
(1) CPSx osi | uL 9 ies | 
初始 化 < B ， ges 
OE y o > (© i dés BLA 
注册 (CPSk) eT m | ist 已 播放 | 
初始 化 ps | BEES 售 上 | | | | 
(4) | 一 CPS) ~ Y uu PIER ape | 
[加 入 (CPSxJ ENG eso 7) D M | mulu LARA 
6) nr FERI | 
MM EP AMEN | 
fe EDO | | [E 
a) b) 


图 12.5 CPS 工作 示例 
a) CPS 建立 b) CPS 的 运行 





以 下 1) ~7) 步 分 别 给 出 了 上 述 各 步骤 之 间 的 交互 (换言之 ， 处 于 活动 状态 的 
组 件 之 间 报 文 序列 的 交换 ) : 

1) 隶属 于 小 组 A 的 某 一 客户 端 CC? 组 织 起 一 个 CPS (以 下 称 为 CPSk) o 

2) CC; 邀请 其 他 三 个 客户 端 (CC). 、CC2 、CC: ) 注册 到 CPS,. 

3) CC}, CC}, CC? 注册 到 CPS,. 

4) CC? 初始 化 CPSk。 

5) QU. COL. CC? HA CPS,. 

6) CC; 开始 媒体 播放 。 在 某 一 时 刻 ， 假 设 CC! 请求“ 暂停”， 几 乎 与 此 同时 
CC! 请 求 “ 拖 动 "， 那 么 CCP 将 胜出 ， 因 为 它 的 指令 要 先 于 其 他 指令 抵达 。 

7) CC? 发 起 一 次 投票 来 终止 CPSx CC}, CC}, CC; 表示 同意 。 


12.4 HCOCOP 


HCOCOP 是 COCOP'? fg CDN 型 架构 上 的 拓展 ， 它 具备 如 下 特性 : 

1) 基于 随机 的 控制 指令 传输 机 制 。 每 一 个 组 成 员 可 在 任意 时 间 发 出 控制 指令 。 
组 成 员 之 间 通 过 避免 显 式 同步 机 制 ( 如 基于 底层 的 协作 机 制 ) 来 增加 系统 的 交互 性 ， 
虽然 这 样 可 能 会 导致 控制 指令 之 间 的 冲突 。 

2) 避免 冲突 的 FCFS 策略 。 如 果 两 个 或 者 多 个 控制 指令 被 组 内 不 同 成 员 近 似 
CHE) 同时 发 出 ， 则 通过 FCFS 策略 选 出 一 个 胜出 者 来 驱动 CPS 改变 状态 ， 其 余 指 令 
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将 被 丢弃 。 

3) 基于 协作 的 降低 无 效 控制 指令 传递 率 的 机 制 。 一 个 组 成 员 在 检测 到 其 他 组 成 
员 发 出 了 控制 指令 时 ， 它 将 避免 再 发 出 控制 指令 。 这 种 机 制 降低 了 指令 冲突 的 可 
能 性 。 

4) 基于 软 状态 的 CPS 状态 管理 。 一 旦 一 个 控制 指令 改变 了 播放 状态 ，CPS 状态 
就 会 通过 报 文 和 计时 器 进行 更 新 ， 并 不 需要 硬 状态 的 管理 。 

HCOCOP 被 映射 到 CPS 〈 以 下 称 为 CPSk) 的 分 层 控制 架构 上 ， 如 图 12.6 所 示 
图 中 也 给 出 了 自动 机 (定义 了 协议 行为 ) 的 位 置 。 当 CPS 执行 时 ， 控 制 结构 的 组 件 
由 COMODIN 协作 平面 上 的 架构 控制 组 件 派生 : 对 于 CPS,, CCC, 是 CCC 组 件 的 前 
端 ，CPCS; 是 第 i 个 CPCS 的 前 端 ，C;" 是 CPS, 中 第 x 个 协作 客户 端 ， 且 由 第 i 个 
CPCS 前 端 提供 服务 。 

HCOCOP 基本 运行 原理 如 下 : 如 果 客 户 端 C， 发 送 控制 指令 ( ClReq)， 其 对 应 
的 CPCS; 在 接受 指令 之 前 会 将 这 个 CIReq 转 给 CCC, 来 解决 潜在 冲突 问题 ， 即 判断 是 
否 关 联 到 其 他 CPCS] (wi) 的 客户 也 几乎 同时 发 送 了 一 个 ClReq 指令 。CCC 接收 
第 一 个 输入 的 CIReq， 并 通知 所 有 CPCS， 并 在 一 个 给 定 的 时 间 段 内 丢弃 其 他 所 有 用 
户 请 求 ， 这 样 就 可 以 规范 用 户 的 交互 性 和 避免 会 话 死 锁 。 与 此 CPCS! 相关 联 的 其 他 
用 户 所 引起 的 潜在 冲突 ， 则 是 由 CPCS; 采用 与 CCC, 相同 的 策略 来 解决 。 


1 
CPCS 服 务 器 
自动 机 















图 12.6 CPS, 的 基于 CDN 的 控制 架构 


HCOCOP 可 以 运行 在 以 下 三 种 协作 模式 中 : 

1) 全 局 协作 (GlobalCoop) , ClReq 一 方面 通过 CPCS* 向 下 转发 给 所 有 与 其 相连 
的 客户 端 ， 另 一 方面 通过 CCC, 转 给 所 有 的 CPCS% (wi), ， 并 由 后 者 转 给 所 有 相连 容 
户 端 。 此 类 机 制 允许 一 个 用 户 检测 到 来 自 其 他 客户 端的 CIReq， 借 此 避免 发 出 可 能 被 
系统 丢弃 的 ClReq 请 求 。 

2) 局 部 协作 (LocalCoop)。ClReq 仅仅 通过 CPCS) 向 下 转发 给 所 有 与 其 相连 的 
客户 端 。 

3) 无 协作 (NoCoop)。ClReq 并 不 转发 给 任何 其 他 用 户 。 
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定义 HCOCOP 行为 的 自动 机 如 图 12.7 所 示 。 当 用 户 发 出 控制 指令 ( UsrReq) 
时 ， 客 户 端 C" 的 自动 机 ( 见 图 12.7a) 发 出 一 个 客户 端 请 求 (ClReq) ， 并 进入 就 绪 
状态 。 在 就 绪 状 态 的 客户 端 CE 感知 到 与 同一 个 CPCS; 相连 的 其 他 客户 端 也 发 送出 
ClReq 请 求 时 (局 部 协作 模式 ) 或 者 其 他 与 CPCS, (wi 相连 的 客户 端 也 发 出 ClReq 
请 求 时 (全 局 协作 模式 ) ， 系 统 也 能 进入 请 求 完成 状态 。 在 该 状态 (自动 机 一 直 保 持 
该 状态 ， 直 到 收 到 回复 ) ， 系 统 对 其 他 客户 端 发 出 的 ClReq 请 求 都 不 予 受理 ， 而 用 户 
Ch" 被 禁止 发 送 新 的 控制 请 求 ， 目 的 是 降低 会 话 负 载 。 当 回复 抵达 时 ， 系 统 开 始 进行 
请 求 处 理 。 为 了 控制 会 话 的 交互 性 程度 ， 新 用 户 的 控制 指令 会 在 一 个 给 定 的 生存 周期 
Ti 内 被 阻止 。 

图 12.7 中 ，CPCS; 的 CPCS 自动 机 可 以 在 就 绪 状态 下 接收 ClReq, ClReq 的 接收 
意味 着 自动 机 进入 了 同步 状态 。 如 果 ClReq 来 自 于 与 它 相连 的 客户 端 ， 那 么 该 CIReq 
(或 者 称 为 上 行 CIReq) 被 转发 给 CCC 服务 器 自动 机 。 并 且 ， 如 果 局 部 或 者 全 局 协作 
模式 得 到 应 用 ， 它 也 会 被 转发 到 其 他 与 之 相连 的 客户 端 上 去 。 如 果 ClReq 来 自 于 CCC 
(例如 ， 由 连接 到 其 他 CPCS 服务 器 上 的 客户 端 产生 的 CIReq), ， 这 样 的 ClReq 请 求 
(或 者 称 为 下 行 CIReq) 被 转发 给 所 有 相连 客户 端 。 在 同步 或 者 就 绪 状 态 下 ， 一旦 接 
收 到 来 自 CCC 服务 器 自动 机 的 回复 ，CPCS 自动 机 处 理 该 回复 并 将 其 转发 给 所 有 相连 
客户 端 。 随 后 ， 自 动机 便 进 入 了 处 理 完成 状态 ， 该 状态 在 一 个 给 定 生存 周期 Tecs A 
会 一 直 保 持 。 引 入 该 延 时 的 目的 是 使 得 客户 端 意识 到 会 话 状态 中 的 所 有 改变 ， 进 而 利 
用 类 似 于 软 状 态 的 模式 "来 管理 组 的 交互 性 。 om 

Reply/ac2 


ClReq[LocalCoop 或 GlobalCoop] 
AE 


acl: if(CIReq.type IS upward){ 
if(LocalCoop OR GlobalCoop) 
forwardToPCSClients(CIReq); 





Reply/ac3 } 
acl: sendToCPCSServer(CIReq); else forward TOCPCScClients(CIReq); 
ac2: process(Reply); setTimer(FTimer, TCC); ac2: process(Reply); 
ac3: process(Reply); resetTimer(FTimer, TCC); sendToCPCSClients(Reqly); 


setTimer(FTimer, TCPCS); 
b) 





acl: if(GlobalCoop) forwardToCPCSServers(CIReq); 
process(CIReq); 
sendToPCSServers(Reply); 
setTimer(FTimer, TCCC); 
c) 


图 12.7 HCOCOP 的 自动 机 
a) KP AL b) CPCS 自动 机 ©) CCC 服务 器 自动 机 
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CCC 服务 器 自动 机 ( 见 图 12. 7c) 在 收 到 由 位 于 就 绪 状 态 下 的 CPCS; 的 CPCS B 
动机 发 出 的 ClReq 请 求 之 后 ， 如 果 当 前 采用 的 是 全 局 协作 模式 ， 那 么 它 将 接受 请 求 并 
转发 给 所 有 其 他 的 CPCS 自动 机 。 一 个 回复 被 送 给 所 有 CPCS 自动 机 ， 且 CCC 服务 器 
自动 机 变 为 同步 完成 状态 ， 该 状态 在 一 个 生存 周期 Tecc 内 会 一 直 保持 。 引 入 这 个 延 时 
的 目的 在 于 确保 HCOCOP 的 连续 性 。 


12.5 HCOCOP 的 仿真 分 析 


本 节 对 HCOCOP 的 性 能 进行 分 析 ， 目 的 是 证 明 在 CDN 中 采用 协作 方法 带 来 的 性 
能 优势 。 本 节 使 用 了 面向 对 象 的 离散 时 间 仿 真 框架 ”来 对 HCOCOP 进行 实现 ， 并 在 
CDN 架构 中 通过 不 同 数量 的 客户 端 和 不 同 的 拓扑 条 件 对 其 性 能 进行 评估 。HCOCOP 
性 能 也 同时 与 星 形 架构 中 的 非 协作 协议 和 协作 协议 进行 了 对 比 。 结 果 显 示 ， 与 星 形 架 
构 相 比 ， 使 用 CDN 的 架构 的 确 能 够 提高 流 控制 效率 。 


12. 5.1 性 能 指标 


一 个 协作 播放 控制 协议 必须 确保 协作 播放 会 话 (CPS) 的 连续 性 ， 并 且 同 时 给 予 
用 户 改 变 播放 状态 的 能 力 。 性 能 指标 可 以 体现 出 一 个 协作 播放 控制 协议 的 相关 特性 ， 
应 考虑 到 对 用 户 发 送 控 制 指令 的 请 求 处 理 和 对 已 发 送 的 控制 指令 的 处 理 (可 参见 
12.4 节 ): 

1) 客户 端 自动 机 允许 或 者 阻止 用 户 请 求 ， 从 而 确定 是 否 像 CIReq 那样 被 发 送 或 
阻止 。 在 进程 完成 状态 中 用 户 请 求 被 阻止 ， 可 确保 CPS 的 连续 性 。 而 在 请 求 完成 状 
态 ， 用 户 请 求 被 阻止 是 因为 需要 分 配 用 户 请 求 优 先 级 的 协作 机 制 正在 起 作用 。 

2) 未 被 阻止 的 用 户 请 求 首 先 作为 ClReq 被 转发 给 客户 端 自动 机 ， 随 后 再 转发 到 
相应 的 CPCS 服务 器 ， 如 果 被 接受 ， 将 继续 被 CPCS 服务 器 转发 到 CCC 服务 器 ， 在 那 
里 再 决定 是 否 接受 。 

在 此 基础 上 我 们 定义 两 个 性 能 指标 ， 即 阻止 概率 (Pu). 和 拒绝 概率 (Pow) 。 
根据 上 述 第 D) 点 ， 阻 止 概率 被 定义 为 用 户 请 求 被 客户 端 自动 机 阻止 的 概率 ; 根据 上 
述 第 2) 点 ,拒绝 概率 定义 为 CIReq 被 CDN 丢弃 或 者 拒绝 的 概率 。 特 别 地 ， 定 义 不 同 
的 拒绝 概率 为 : DP, (CPCS), iE XH ClReq 被 相应 CPCS 服务 器 丢弃 的 概率 ; © 
Py, 〈CCC) ， 定 义 为 CIReq 被 CCC 服务 器 丢弃 的 概率 ; GPS (CDN), ， 有 时 也 称 为 
全 拒绝 概率 ， 定 义 为 一 个 客户 端 请 求 被 CPCS 服务 器 或 CDN 的 CCC 服务 器 丢弃 的 概 
率 ， 计 算 公 式 为 Pps (CPCS) + (1-Pyy (CPCS)) Poes (CCC), 

拒绝 概率 应 当 越 小 越 好 ， 因 为 服务 器 拒绝 请 求 的 现象 在 发 出 该 请 求 的 用 户 看 来 绝 
非 好 事 。 事 实 上 ， 当 一 个 用 户 请 求 被 转发 给 网 络 时 ， 尽 管 发 出 该 请 求 的 用 户 充分 意识 
到 他 /她 不 可 能 控制 服务 器 ， 但 依然 期 望 其 请 求 能 够 被 接受 。 阻 止 概率 也 应 当 被 设置 
为 一 个 足够 低 的 值 ， 因 为 它 实际 上 表示 了 用 户 发 送 控制 请 求 的 无 效 性 。 然 而 ， 拒 绝 概 
率 比 阻止 概率 更 重要 ， 因 为 一 般 而 言 ， 相 比 无 法 发 送 控制 指令 ， 发 出 的 控制 请 求 被 拒 
绝 让 用 户 更 加 无 法 忍受 。 
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12.5.2 仿真 参数 


本 他 描述 了 仿真 系统 中 的 参数 和 相关 设置 ， 目 的 是 定义 一 个 相对 真实 的 仿真 环 
境 ， 使 得 在 CDN 控制 架构 下 对 HCOCOP 的 评估 尽量 真实 可 靠 (12.4 节 中 涉及 部 分 内 
容 ) 。 Š 

首先 ， 考 虑 更 一 般 化 的 参数 ， 如 每 一 次 仿真 会 话 的 持续 时 间 和 用 户 活跃 度 ; 其 
次 ,重点 关注 运行 能 够 定性 描述 CDN 控制 架构 的 参数 (如 链 路 延 时 、 处 理 延 时 、 定 
ars) 和 星 形 架构 的 参数 ， 供 比较 使 用 。 

1. 一 般 参 数 

一 次 仿真 运行 时 间 ， 即 仿真 会 话 期 Tssssos ， 被 设置 为 一 段 允许 针对 一 个 预定 的 
统计 相关 度 得 出 性 能 指标 的 时 间 (〈 例 如， 至少 0.95 的 概率 说 明 统计 误差 在 5% 以 
内 ) 。 

同一 个 用 户 发 出 的 两 个 连续 请 求 的 平均 抵达 间隔 时 间 CAPR REE) 由 平均 请 
求 抵达 间隔 时 间 (MRIT) 来 描述 ，MRIT 通过 基于 Camma 概率 分 布 函数 的 统计 模型 
HITER., PERI, PERERA WS 个 等 级 非常 低 (MRIT z 15min) 、 低 
(10min x MRIT < 15min) 、 中 等 (Smin<MRIT < 10min) 、 高 (120s<MRIT < 5min) 、 
非常 高 (MRIT «120s) 。 为 了 能 够 完全 地 对 HCOCOP 中 从 高 到 非常 高 的 用 户 活 路 度 进 
行 评估 ，MRIT 的 值 被 设 为 在 区 间 |10s，180s| 中 浮动 。 

2. CDN 参数 

两 个 相 邻 节点 之 间 的 延 时 (6) 通过 下 列 连 接 延 时 模型 定义 : 

6, = K6, + N(K5,，V 有 5) 

K,+K,=1 K,,K, 20 
AP, ô, 是 平均 延 时 ， 而 6; 是 一 个 给 定 报 文 的 实时 延 时 ， 由 一 AMBUEBURI AE 
化 部 分 构成 。K; 和 K, 的 值 是 固定 部 分 和 变化 部 分 的 权重 系数 ，K 设置 为 0.7。5; 的 
变化 部 分 由 服从 正 态 分 布 的 随机 变量 生成 ， 其 均值 和 方差 设 为 及 5,。 该 正 态 分 布 在 
-K ô, 处 截断 ， 以 确保 6, 不 为 负 。 选 择 正 态 分 布 是 根据 Gibbon 等 人 的 相关 研究 ”。 
延 时 模型 的 参数 通过 位 于 意大利 和 西班牙 的 CDN 测试 平台 的 测量 值得 到 " 。 特 别 地 ， 
用 户 和 相应 CPCS 服务 器 之 间 的 连接 延 时 5, 设 为 3ms， 而 对 CPCS 服务 器 和 CCC 服务 
器 之 间 的 连接 设置 为 6lms。 为 了 公平 比较 ， 星 形 架构 中 用 户 和 服务 器 之 间 的 5, 设 
为 64ms。 

服务 器 处 理 延 时 (Twoc) 是 CDN 服务 器 (CPCS 或 者 CCC) 占用 的 时 间或 者 星 
形 服务 器 用 来 服务 一 个 接收 到 的 请 求 并 且 改 变 CPS 相应 状态 的 时 间 ，7Troc 被 设置 
为 200ms。 

服务 器 定时 器 (Tue. Tos. Tec) 用 于 控制 服务 器 的 反应 (Tccc 和 Tercs) 和 系统 
整体 的 交互 性 。 它 们 都 设 为 3. 08， 与 用 户 定时 器 Tc 相同 。Fortino 等 人 "指出 ， 这 个 
设置 值 可 以 避免 系统 的 死 锁 现 象 。 
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12.5.3 HCOCOP 的 运行 模式 


本 节 中 ， 分 析 12. 4 节 中 定义 的 无 协作 、 局 部 协作 和 全 局 协作 等 运行 模式 ， 并 对 
其 进行 比较 。 另 外 ， 也 将 上 述 结 果 与 基于 COCOP 协议 的 星 形 架构 的 仿真 结果 进行 对 
比 。 星 形 模式 是 目前 中 心 化 协作 播放 架构 的 代表 ， 其 中 控制 信息 仅仅 由 单一 服务 器 进 
行 处 理 ( 见 12.2 节 ) , COCOP 协议 有 两 种 不 同 模式 : 协作 (Coop) 和 无 协作 ( No- 
Coop) 模式 ， 并 通过 两 种 自动 机 进行 定义 : COCOP 客户 端 进程 自动 机 (与 HCOCOP 
的 客户 端 自动 机 很 相似 ， 参 见 12.4 节 ) 和 COCOP 服务 器 进程 自动 机 ， 后 者 与 HCO- 
COP 的 CPCS 自动 机 很 相似 ， 但 并 不 具备 同步 状态 ， 因 为 在 星 形 结构 中 没有 必要 和 其 
他 服务 器 进行 同步 。 另 外 ， 星 形 结构 系统 中 使 用 的 控制 协议 (MASH Rover 和 ViCRO 
等 ,参见 12.3 节 ) 都 与 COCOP 处 于 无 协作 模式 下 的 运行 方式 很 相似 ， 甚 至 可 以 被 认 
为 是 这 些 协 议 的 一 个 典型 ， 因 此 也 可 以 用 于 性 能 比较 中 。 


12.5.4 ”性 能 评估 


仿真 阶段 的 目的 是 评估 HCOCOP 在 一 个 简单 的 基于 CDN 的 架构 中 的 性 能 ， 该 架 
构 有 两 个 小 组 和 12 个 用 户 ， 这 个 规模 对 于 协作 播放 会 话 而 言 已 经 足够 大 了 ， 因 为 这 
种 会 话 主要 是 针对 中 小 型 用 户 组 设计 。 

我 们 给 出 了 使 用 对 称 拓扑 的 基于 CDN 架构 的 结果 。 然 后 ， 检 测 了 在 非 对 称 拓扑 
和 自 适应 情况 下 HCOCOP 的 性 能 ， 自 适应 情况 是 指 一 个 用 户 从 一 个 CPCS 服务 器 动态 
重 定向 到 另 一 个 。 

1. 对 称 拓扑 结构 的 CDN 

本 节 进 行 了 包括 12 个 客户 端 和 2 个 CPCS 服务 器 的 对 称 CDN 的 一 组 仿真 。 因 为 
拓扑 的 对 称 性 ， 每 一 个 CPCS 分 配 到 6 个 客户 端 ， 如 图 12. 8 所 示 。 


e 
/ WAS 
p 3 
CPCS CPCS 
"T ) 服务 器 
A |\ A NN 
/ / 
ÁN FPES 
客户 端 客户 端 


图 12.8 对 称 CPCS 架构 (分 为 两 组 ,每 组 6 个 客户 端 ) 


图 12.9 显示 了 CPCS 服务 器 上 的 拒绝 概率 Pu, (CPCS), ME 12.9 中 能 够 清楚 
地 看 出 协作 模式 的 优势 。 如 12.4 节 中 所 述 ， 当 用 户 进程 感知 到 连接 到 同一 台 CPCS 
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10e0 


Pyen(CPCS)}-NoCoop —*x— 
Fy—n(CPCS)-LocalCoop —&— 
10e-1 中 Pyen(CPCS)-GlobalCoop 一 号 一 


10e 一 


Pon (CPCS) 


10e-3 
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12.9 CPCS 服务 器 上 的 拒绝 概率 : 无 协作 、 局 部 协作 和 
全 局 协作 模式 之 间 的 比较 结果 


服务 器 的 另 一 个 客户 端 已 发 送 请 求 时 ， 局 部 协作 模式 便 阻 止 该 客户 端 发 送 控制 指令 。 
此 模式 的 使 用 能 极 大 地 降低 在 无 协作 模式 下 的 拒绝 概率 。 在 全 局 协作 模式 下 ， 协 作 模 
式 的 好 处 得 到 了 强化 ， 因 为 连接 到 给 定 CPCS 服务 器 的 客户 端 也 能 够 检测 到 连接 到 其 
他 CPCS 服务 器 的 客户 端 所 发 出 的 请 求 。 

图 12. 10 表明 CCC 服务 器 中 的 拒绝 概率 Py, (CCC) 并 没有 被 协作 方法 改善 。 
不 过 ， 因 为 局 部 组 级 的 优化 ， 全 拒绝 概率 的 值 Pos (CON) 在 全 局 协作 模式 下 要 相 
对 低 很 多 ( 见 图 12.11)。CDN 和 中 心 型 架构 (如 星 形 ) 的 拒绝 概率 也 在 图 12. 11 中 
进行 了 比较 。 在 CDN 中 ,局 部 协作 和 非 协作 模式 下 的 拒绝 概率 也 与 在 星 形 架构 中 相 
应 模式 的 拒绝 概率 不 相 上 下 。 然 而 , 在 CDN 全 局 协作 模式 下 得 到 的 拒绝 概率 要 比 其 
他 情况 下 的 概率 低 得 多 。 因 此 ，CDN 架构 和 协作 机 制 相 结合 能 够 使 客户 端 控 制服 务 
器 的 能 力 获得 极 大 的 提升 。 


10e-1 


Fg. (CCC) -NoCoop. —*— 
Fg, (CCC)-LocalCoop —&— 
Fg, (CCC)-GlobalCoop 一 号 一 


10e 一 
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图 12.10 CCC 服务 器 中 的 拒绝 概率 : 无 协作 、 局 部 协作 和 
全 局 协作 模式 之 间 的 比较 结果 
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Pygx (Star) -NoCoop - *- 
Poen(Star)—Coop ~ €- 
| Pen(CDN)—NoCoop 
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图 12. 11 全 拒绝 概率 : 处 于 协作 与 无 协作 模式 下 的 
CDN 和 星 形 架构 之 间 的 比较 结果 
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图 12.12 阻止 概率 : 处 于 协作 与 无 协作 模式 下 的 
CDN 和 星 形 架 构 之 间 的 比较 结果 

需要 注意 的 是 ， 虽 然 拒 绝 概 率 是 主要 性 能 指标 ， 但 该 性 能 的 提升 是 以 牺牲 阻止 概 
率 的 代价 获得 的 。 图 12. 12 表明 ， 无 论 协作 模式 〈 无 协作 、 局 部 或 者 全 局 协作 模式 ) 
还 是 系统 架构 ( 星 形 或 者 CDN) ， 都 未 对 阻止 概率 产生 明显 的 影响 。 

2. 非 对 称 CDN 拓扑 和 动态 客户 端 重 定向 

本 节 进 行 了 一 系列 仿真 实验 ， 用 来 检测 HCOCOP 在 一 个 由 12 个 非 对 称 分 布 于 2 
台 CPCS 服务 器 之 间 的 客户 端 所 组 成 的 CDN 架构 的 性 能 ， 如 图 12. 13 所 示 。 具 体 地 
说 ,7 个 客户 端 分 配给 其 中 一 台 服 务 器 ， 其 他 5 个 客户 端 被 分 配给 另外 一 台 。 可 以 设 
想 ， 在 对 称 拓扑 中 一 个 客户 端 被 一 台 服 务 器 转移 到 (或 者 被 重 定向 到 ) 另外 一 台 ， 
就 可 以 得 到 这 种 非 对 称 拓扑 结构 。 

为 了 更 好 地 理解 这 种 情况 ， 可 以 回忆 一 下 在 CDN 中 如 何 使 用 一 个 请 求 路 由 算法 
将 客户 端的 请 求 路 由 到 一 个 合适 的 代理 缓存 服务 器 ， 在 本 例 中 也 就 是 将 客户 端 分 配给 
特定 的 CPCS 服务 器 。 在 自 适应 请 求 路 由 例子 中 ， 可 以 根据 CDN 的 当前 情况 动态 
地 改变 代理 缓存 服务 器 ， 这 也 是 本 例 中 将 要 考察 的 情况 。 下 面 将 对 此 进行 描述 。 


第 12 章 基于 CDN 的 协作 流 媒 体 服 务 251 





CPCS < ) CPCS 
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ANN 
AN / \\ j 
| / NN 
LQ. oe 
客户 端 客户 端 
图 12.13 非 对 称 性 CDN 架构 (分 为 2 组 ,每 组 有 7 和 5 个 客户 端 ) 


图 12. 14 给 出 了 在 协作 模式 和 非 协作 模式 下 分 属 两 个 小 组 的 客户 端 所 感受 到 的 全 
拒绝 概率 。 比 较 结 果 显 示 ， 在 无 协作 模式 下 两 组 的 拒绝 概率 没有 差别 。 然 而 ， 在 协作 
模式 下 〈 局 部 协作 和 全 局 协作 ) ， 隶 属于 较 大 组 的 客户 端 将 会 有 更 多 的 机 会 去 控制 会 
话 状态 。 这 个 现象 可 以 视 为 协作 机 制 的 优点 。 事 实 上 ， 同 一 个 小 组 内 的 客户 端 聚集 在 
一 起 就 可 以 提高 小 组 所 有 参与 者 的 性 能 。 具 体 而 言 ， 该 现象 可 解释 如 下 : 在 局 部 层 
面 ， 协 作 机 制 允 许 客户 端 感知 到 其 他 客户 端 发 送 的 请 求 ， 因 此 ， 在 同一 个 小 组 的 客户 
端 数量 越 多 ， 客 户 端 就 会 越 能 避免 发 送 可 能 被 本 地 CPCS 服务 器 丢弃 的 请 求 ， 而 这 就 
能 够 均衡 因 局 部 客户 端 数 增加 而 导致 的 局 部 并 发 性 问题 。 另 外 ,一旦 属于 较 大 组 的 一 
个 局 部 获得 了 本 地 CPCS 服务 器 的 控制 权 ， 它 就 比 其 他 组 的 客户 端 有 更 大 的 几率 去 控 
iii] CCC 服务 器 。 事 实 上 ， 较 大 的 组 会 转发 给 CCC 服务 器 更 多 请 求 ， 因 此 ， 这 些 请 求 
在 CDN 较 高 层面 上 遇 到 并 发 性 问题 的 几率 要 比 从 较 小 组 转发 出 的 请 求 所 对 应 的 几率 
低 得 多 。 根 据 这 个 结果 ， 客 户 端 能 够 被 有 利 地 重 定向 到 现 有 的 组 ， 而 孤立 的 用 户 或 者 
属于 较 小 组 的 客户 端 会 没有 这 个 优势 。 

s Poen(CDN)-NoCoop(5) —3-— 
Ppg«(CDN)-NoCoop(7) - *- 
Pygy«(CDN)-LoCoop(5) 一 号 一 
Poen(CDN}-LoCoop(7) - &- 
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图 12.14 全 拒绝 概率 处 于 无 协作 、 局 部 协作 和 全 局 协作 
模式 下 的 非 对 称 式 CDN 的 比较 结果 
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另外 ， 两 组 客户 端的 阻止 概率 并 没有 表现 出 明显 的 区 别 。 

图 12. 15 显示 了 一 个 客户 端 从 一 个 组 被 动态 重 定向 到 另 一 个 组 所 产生 的 影响 ,此 
时 ， 系 统 拓 扑 从 每 组 原来 6 个 客户 端的 对 称 结构 变 成 了 分 别 为 7 个 和 5 个 客户 端的 非 
对 称 结构 。 作 为 对 图 12. 14 中 所 给 出 结果 的 一 种 确认 ， 当 客户 端 被 重 定 向 到 另外 一 个 
组 后 ， 该 组 的 全 拒绝 概率 降低 了 ， 同 时 原来 所 属 组 的 全 拒绝 概率 则 有 所 增加 。 然 而 ， 
对 称 拓扑 情况 下 的 拒绝 概率 处 于 中 间 位 置 。 这 也 可 以 通过 另外 一 种 方式 说 明 : 如 果 初 
始 配置 是 非 对 称 的 ， 那 么 客户 端的 重 定向 可 以 形成 一 个 对 称 拓扑 ， 这 种 方式 能 够 在 客 
户 端 之 间 实 现 更 好 的 公平 。 
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图 12. 15 ”客户 端 重 定向 对 全 拒绝 概率 的 影响 : 对称 式 CDN 和 非 对 称 式 CDN 架构 
(由 客户 端 从 一 台 CPCS 服务 器 重 定向 至 另 一 台 CPCS 服务 器 导致 ) 之 间 的 比较 结果 


相对 于 拒绝 概率 ， 阻 止 概率 几乎 不 会 受到 客户 端 重 定向 的 影响 。 

从 上 面 的 结果 可 以 看 出 ， 相 对 于 拒绝 概率 ， 提 高 CDN 架构 的 平衡 性 可 以 改进 请 
求 路 由 算法 以 及 其 他 常用 参数 如 网 络 邻近 性 、 客 户 端 一 服务 器 延 时 、 代 理 缓 存 服务 器 
负载 等 。 这 些 参 数 的 组 合 最 近 成 为 了 研究 热点 ， 其 目的 在 于 开发 一 个 路 由 算法 使 其 不 
仅 能 够 提升 数据 的 传输 速率 ， 更 能 够 提升 会 话 控制 协议 的 效率 。 


12.6 与 给 使 用 者 


基于 CDN 的 架构 所 支持 的 CPS 的 开发 和 部 署 提 供 了 在 现 有 互联 网 设施 上 实现 协 
作 播 放 服 务 的 可 能 性 ， 也 使 得 一 些 重 要 的 应 用 领域 从 网 络 学 习 扩展 到 了 网 络 娱乐 。 

基于 CDN 的 CPS 可 以 有 效 地 支持 协作 式 按 需 学 习 (CLoD) 的 网 络 学 习 项 目 ” ， 
这 是 一 种 虚拟 的 协作 学 习 方 法 ， 能 够 令 参与 其 中 的 学 生发 送 请 求 、 观 看 和 控制 课堂 节 
目的 播放 和 问题 的 交互 ， 从 而 形成 一 个 自主 的 交互 式 学 习 过 程 。CLoD 参考 了 教学 视 
频 辅导 (TVI) 和 分 布 式 教学 视频 辅导 (DTV) 学 习 方法 和 工具 的 一 些 思想 ， 在 这 
些 方法 中 一 个 学 生 小 组 在 导师 的 指导 下 学 习 一 段 课 程 视频 。DTVI 是 TVI 的 完全 虚拟 
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版 本 ” ， 其 中 每 个 学 生 都 有 一 台 联网 的 计算 机 ， 配 有 视频 (摄像头) 和 音频 (麦克 
风 和 耳机 ) 设备， 用 于 在 组 内 的 彼此 沟通 。TVI 和 DTVI 的 应 用 都 已 证 明 ， 参 与 实验 
的 学 生 比 真正 课堂 上 的 学 生 表现 更 好 。CLoD 和 DTV 之 间 的 区 别 在 于 ，CLoD 没有 假 
设 负责 指导 学 生 的 导师 的 存在 。 事 实 上 , 在 DTVI 中 只 有 导师 能 够 控制 视频 会 议 记录 
设备 (VCR)， 而 在 CLoD 中 每 一 个 播放 会 话 的 参与 者 都 能 在 分 组 的 导师 授课 中 使 用 
共享 的 VCR 遥控 器 。 

基于 CDN 的 CPS 也 能 够 应 用 于 电子 娱乐 应 用 方面 ， 如 虚拟 剧场 ， 即 在 一 个 分 布 
式 的 虚拟 环境 里 用 户 的 化 身 (虚拟 自我 形象 ) 通过 交换 意见 或 者 聊天 来 进行 交互 并 
协作 观看 或 控制 电影 。 


12.7 未 来 研究 方向 


本 章 所 提 到 的 基于 CDN 的 架构 ， 在 提高 服务 效率 和 服务 质量 方面 已 进一步 增强 。 
特别 地 ， 本 章 所 定义 的 HCOCOP 在 控制 指令 上 没有 区 别 ， 但 是 ， 将 不 同 控制 策略 与 
不 同 控制 指令 相 结合 可 以 对 协作 播放 会 话 实 现 更 有 效 的 控制 。 一 个 针对 星 形 架构 的 多 
策略 播放 控制 协议 由 Fortino 等 人 ”提出 ， 其 中 作者 定义 了 三 种 策略 (分 别 基 于 随机 、 
令 牌 和 投票 )， 并 根据 语义 内 容 将 其 与 相应 的 控制 指令 (暂停 、 播 放 、 拖 动 和 停止 ) 
联系 起 来 。 针 对 暂停 控制 指令 的 处 理 需 要 具备 高 度 的 交互 性 ， 因 为 它 需 要 被 HCOCOP 
的 随机 策略 所 支持 。 针 对 播放 / 拖 动 控制 指令 ， 则 需要 被 令 牌 环 机 制 支持 ， 该 机 制 允 
许 持 令 牌 者 发 送 控制 指令 。 最 后 ， 针 对 停止 控制 指令 的 处 理 (接受 停止 控制 指令 会 
终止 CPS) 应 当 基 于 多 数 原则 来 完成 ， 这 就 使 投票 机 制 得 到 有 效 的 应 用 。 

COMODIN 系统 提供 了 在 一 个 CPS 的 组 成 员 之 间 的 最 优 媒 体 流 同步 方法 。CDN 或 
用 户 端 的 同步 机 制 可 以 保证 组 内 所 有 成 员 能 够 同步 观看 多 媒体 会 话 ， 但 是 这 种 同步 机 
制 尚未 得 到 支持 。 目 前 的 一 个 研究 内 容 ， 是 定义 由 CDN 驱动 的 同步 机 制 ,该 机 制 能 
够 在 不 增加 客户 端 负担 的 前 提 下 提供 多 媒体 播放 的 最 优 同步 效果 。 


12.8 结论 


本 音 提出 了 一 种 新 型 的 CDN 架构 ， 它 支持 协作 式 流 媒体 服务 ， 并 允许 显 式 形成 
的 同步 用 户 组 来 选择 、 观 看 和 协作 地 控制 一 个 多 媒体 会 话 。 播 放 会 话 的 控制 由 HCO- 
COP 实现 ， 且 通过 离散 事件 仿真 对 其 性 能 进行 了 评估 。 仿 真 结果 表明 ， 与 通常 使 用 
的 星 形 架构 相 比 ， 基 于 CDN 的 分 层 方法 具有 更 高 的 效率 ， 因 为 拒绝 概率 降低 的 同 
时 ， 阻 止 概率 并 没有 产生 明显 的 影响 。 另 外 一 个 很 有 意思 的 结果 是 ， 在 非 对 称 拓 
扑 中 当 客户 端 被 分 配 到 客户 端 数 较 多 的 组 时 ， 要 比 孤 立 客户 端 或 者 属于 较 小 组 的 
客户 端 得 到 更 好 的 服务 。 如 果 与 其 他 参数 (如 网 络 邻 近 性 、 客 户 端 一 服务 器 延 时 
和 代理 缓存 服务 器 负载 等 ) 相 结合 ， 那 么 就 可 以 用 于 对 CDN 重要 组 件 之 一 的 请 求 


路 由 算法 进行 优化 。 
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B13 通过 了 正 进 行 直播 和 点 播 视频 服 务 的 CDN 


Miroslaw Czyrnek, Ewa KuSmierek Cezary Mazurek, Maciej Stroifiski 和 Jan Weglarz 
13.1 引言 


现 阶段 通过 宽带 IP 网 络 的 视频 点 播 服 务 和 直播 电视 节目 播放 服务 已 经 开始 变 得 
普及 。 用 户 希 望 在 任意 时 间 和 任意 地 点 通过 身边 现 有 设备 以 互动 的 方式 访问 高 质量 视 
频 ， 而 传统 的 电视 分 发 平台 难以 满足 这 样 的 需求 。 另 外 ， 宽 带 IP 网 络 中 的 内 容 分 发 
技术 能 够 让 内 容 提供 商 提供 增值 服务 ， 使 真正 交互 式 的 内 容 访问 成 为 可 能 。 然 而 ， 设 
计 大 规模 、 基 于 P 的 多 媒体 内 容 分 发 系统 面临 着 挑战 ， 主 要 来 自 数据 量 累积 和 总 传 
输 速率 的 限制 。 信 号 处 理 技术 的 进步 可 以 在 不 增加 带宽 要 求 的 前 提 下 将 高 质量 的 信号 
传递 给 端 用户 ，1Mbit/s 的 速率 被 认为 可 以 获得 足够 理想 的 传输 质量 。 然 而 ， 在 这 样 
的 速率 下 对 大 量 用 户 提供 实时 服务 ， 会 带 来 另外 的 挑战 。 

内 容 分 发 网 络 (CDN) 就 是 一 种 互联 网 应 用 的 解决 方案 。 在 宽带 人 P 网 络 上 CDN 
的 优势 是 显而易见 的 ， 但 与 针对 传统 Web 内 容 的 CDN 和 专门 为 多 媒体 内 容 所 设计 的 
CDN 相 比 则 存在 一 些 区 别 。 针 对 传统 Web 内 容 所 设计 的 CDN 一 般 只 需要 负责 低 质量 
内 容 流 的 直接 分 发 服务 。 而 另 一 方面 ， 多 媒体 CDN 的 目的 在 于 分 发 能 够 与 传统 广播 
媒体 质量 媲美 的 多 媒体 内 容 ， 并 支持 相关 服务 “”。 以 上 对 于 数字 视频 和 音频 传送 的 
特殊 性 能 的 种 种 需求 考虑 都 源 于 多 媒体 内 容 的 特殊 性 。 

本 章 讨论 基于 TVP 平台 的 多 媒体 CDN 设计 的 关键 问题 。iTVP 是 一 个 基于 四 网 
的 多 媒体 内 容 分 发 平台 ， 能 够 面向 全 国 对 大 量 同 时 在 线 用 户 进行 服务 。iTVP 平台 服 
务 包 括 访问 直播 电视 节目 、 视 频 点 播 和 音频 点 播 、 时 间 平 移 、 电 子 节目 向 导 (EPG), 
个 人 录像 机 (PVR) 等 。 考 虑 到 操作 的 范围 和 提供 内 容 的 自身 特性 ， 高 效 的 内 容 分 发 
对 于 平台 的 正常 运转 而 言 非常 必要 。 因 此 ，CDN 成 为 iTVP 平台 的 核心 组 件 之 一 。 

我 们 设计 的 CDN 中 ， 关 键 在 于 系统 的 分 层 本 质 ， 其 中 副本 服务 器 被 置 于 高 一 级 
的 层次 中 ， 而 底层 节点 被 放置 在 运营 网 络 的 “最 后 一 公里 ” 层 〈 即 与 用 户 相连 部 
分 ) 。 从 整体 上 CDN 被 分 为 自治 但 相互 协作 的 不 同 区 域 。 我 们 将 内 容 缓存 和 内 容 复制 
集成 起 来 ， 并 利用 了 处 于 CDN 高 层 的 协作 复制 的 优势 。 内 容 分 发 以 文件 下 载 的 模式 
执行 并 传 至 在 低层 节点 处 ， 再 以 流 模式 从 低层 节点 传 到 端 用 户 处 。 这 种 方法 使 得 我 们 
能 够 采用 相对 简单 易 行 的 流量 模型 ， 与 使 用 VBR 编码 的 视频 模型 相 比 更 加 方便 ， 因 
此 简化 了 带宽 的 管理 。 我 们 在 每 个 区 域内 都 使 用 中 心 内 容 目录 来 解决 内 容 定位 的 问 
题 。CDN 的 监控 子 系统 提供 必要 信息 供 系统 选择 最 适合 的 节点 ， 将 其 分 配给 指定 用 


户 以 提供 服务 。 
本 章 提出 了 ITVP 的 内 容 分 发 架构 、 塘 能 性 结构 和 运行 原理 ， 解 释 了 副本 服务 器 
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的 放置 、 内 容 分 配 和 分 发 、 用 户 请 求 路 由 的 相关 规则 。CDN 的 特点 在 于 确保 有 效 的 
资源 利用 、 可 靠 性 与 可 扩展 性 的 机 制 ， 因 此 本 文 解决 对 资源 (如 带宽 和 存储 ) 的 需 
求 问题 ， 特 别 讨论 了 高 质量 多 媒体 流 ， 并 探讨 了 端 用 户 处 的 服务 质量 (QoS) 问题 。 

本 章 内 容 如 下 : 在 13.2 5, 介绍 了 背景 知识 和 多 媒体 CDN 的 相关 内 容 ; 对 于 
ITVP 的 介绍 和 整体 平台 的 概况 性 描述 在 13. 3 节 中 给 出 ; 接 下 来 13.4 ~ 13. 6 节 重 点 关 
tk CDN 功能 上 的 一 些 关 键 问题 ， 如 副本 服务 器 放置 问题 、 内 容 分 配 与 分 发 问题 以 及 
用 户 请 求 路 由 问题 ， 系统 中 收集 到 的 运行 数据 和 相关 性 能 分 析 在 第 13.7 节 给 出 ; 在 
第 13. 8 节 中 给 出 未 来 的 研究 方向 ; 13. 9 节 是 对 未 来 多 媒体 CDN 的 一 些 见 解 ; 最 后 ， 
在 第 13. 10 节 中 总 结 整 章 内 容 。 


13.2 ”背景 和 相关 研究 工作 


面向 多 媒体 内 容 的 CDN 和 传统 面向 Web 对 象 内 容 分 发 的 CDN 不 同 。 多 媒体 内 容 
具备 和 其 他 类 型 内 容 完全 不 同 的 特性 ， 并 且 多 媒体 内 容 的 本 质 特性 会 影响 到 CDN 诸 
多 方面 的 设计 ， 如 CDN 拓扑 架构 、 副 本 服务 器 的 数量 和 放置 地 点 、 内 容 分 配 和 分 发 
等 。 本 节 对 多 媒体 CDN 在 设计 和 运行 时 需要 重点 考虑 的 几 个 方面 进行 简要 介绍 。 在 
CDN 的 设计 和 运行 中 需要 考虑 到 多 媒体 的 若干 特性 ， 这 些 特 性 可 以 大 致 分 为 两 类 : 
第 一 类 是 多 媒体 内 容 对 象 的 特性 ， 如 典型 数据 容量 和 编码 技术 ; 另 一 类 是 分 发 和 内 容 
访问 模式 。 


13.2.1 多 媒体 特性 影响 


从 多 媒体 特性 对 CDN 总 成 本 的 影响 开始 介绍 ， 具 体 而 言 主要 关注 对 与 带宽 相关 
的 分 发 成 本 和 存储 成 本 的 影响 。 多 媒体 对 象 的 尺寸 一 般 而 言 要 远 远 大 于 Web X. 
视频 的 大 小 取决 于 一 系列 参数 ， 如 分 辨 率 和 编码 类 型 等 ,通常 lh 长 度 的 视频 其 大 小 
在 数 百 MB 或 者 几 个 CB。 另 外 ， 现 在 并 没有 一 种 通用 视频 编码 速率 能 适用 于 所 有 用 
户 。 编 码 率 越 高 ， 视 频 质 量 越 高 ， 因 此 应 在 可 用 带宽 的 约束 下 最 大 化 编码 率 。 视 频 一 
般 会 被 编码 成 多 种 格式 ， 使 不 同 用 户 可 以 根据 自己 的 网 络 带宽 情况 选择 不 同 的 质量 格 
式 。 这 样 的 方式 会 进一步 增加 视频 对 象 大 小 。 因 此 ， 副 本 服务 器 无 法 存储 用 户 要 访问 
的 所 有 内 容 。 用 户 可 能 需要 通过 不 同 的 副本 服务 器 来 获得 不 同 的 对 象 ， 而 非 仅 仅 在 一 
台 最 近 的 服务 器 上 获取 所 有 内 容 。 存 储 空间 必须 被 认为 是 一 种 有 限 资源 ， 而 且 对 于 整 
体 成 本 而 言 ， 当 考虑 服务 器 数量 和 放置 问题 时 ， 存 储 问题 变 得 尤为 重要 。 不 仅 如 此 ， 
大 数据 对 象 对 于 带宽 的 使 用 会 带 来 更 高 的 分 发 成 本 。 因 此 ，CDN 网 内 的 分 发 成 本 ， 
例如 从 源 服务 器 到 副本 服务 器 以 及 从 一 个 CDN 节点 到 另 一 个 节点 的 成 本 等 ， 都 应 当 
作为 从 CDN 节点 直接 到 端 用 户 的 成 本 之 外 的 额外 的 内 容 分 发 成 本 而 加 以 考虑 ， 即 整 
个 分 发 过 程 分 为 网 内 和 网 外 两 步 。Yang 等 人 分 析 了 在 多 媒体 CDN 中 ， 副 本 服务 器 
数量 对 这 种 两 步 分 发 方法 的 成 本 的 影响 。 他 们 的 结论 是 ， 过 多 数量 的 副本 服务 器 会 导 
臻 CDN 内 的 分 发 成 本 实际 上 被 少数 用 户 所 承担 ， 这 样 一 来 过 多 的 服务 器 反而 导致 整 
体 成 本 超出 最 优 。 因 此 ， 需 要 谨慎 选择 副本 服务 器 的 数量 。 
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在 CDN 中 ， 多 媒体 内 容 的 另外 一 个 至 关 重 要 的 特性 在 于 视频 编码 策略 。 多 媒体 
内 容 不 像 Web 页 面 内 容 那样 频繁 变化 ， 因 此 缓存 一 致 性 的 问题 并 不 突出 。 然 而 ， 因 
为 多 媒体 内 容 分 发 有 确定 的 资源 需求 ， 大 多 数 都 与 内 容 流 分 发 的 可 用 带宽 有 关 ， 因 此 
同一 个 多 媒体 内 容 可 以 在 CDN 内 部 存在 多 个 不 同 质量 的 版 本 。 特 别 地 ， 内 容 可 以 被 
编码 为 分 层 形式 ， 这 样 在 带宽 允许 的 范围 内 ， 用 户 具 有 能 够 接收 尽 可 能 多 的 层 和 尽 可 
能 高 质量 的 选择 。 层 可 以 被 编码 为 一 种 视频 质量 逐步 增加 的 分 级 递 进 形式 ， 但 必须 逐 
级 相 结合 ， 才 能 提升 视频 质量 。 因 此 ， 层 与 层 之 间 并 非 分 离 的 对 象 ， 而 是 紧密 联系 。 
对 于 每 级 的 复制 都 需要 做 出 相应 的 决策 ，Su 等 人 ”提出 了 一 种 分 级 多 媒体 内 容 的 复 
制 方 法 ， 其 目的 在 于 减少 内 容 访问 时 间 和 存储 成 本 。 


13.2.2 多 媒体 分 发 和 访问 模式 影响 


多 媒体 内 容 一 般 以 流 的 模式 进行 分 发 ， 这 使 得 用 户 能 够 在 收 到 内 容 后 的 很 短 时 间 
内 立刻 播放 ， 这 一 点 与 内 容 下 载 模式 完全 不 同 。 使 用 流 作为 分 发 模式 对 于 CDN 的 运 
转 而 言 意义 重大 ， 已 经 有 很 多 相关 技术 用 于 提升 内 容 流 系统 的 可 扩展 性 "1591。 
这 些 技术 一 般 而 言 是 基于 组 播 的 传输 模式 ， 优 势 在 于 当 一 个 流 被 分 发 到 大 量 用 户 时 ， 
能 够 降低 服务 器 带宽 的 利用 率 。 在 网 络 层 或 者 应 用 层 中 使 用 组 播 技术 改变 了 以 往 单 播 
环境 下 分 发 成 本 依赖 于 副本 服务 器 数量 的 状况 。 在 单 播 环境 中 ， 服 务 器 总 带宽 并 不 依 
赖 于 副本 服务 器 的 数量 或 者 它们 的 放置 地 点 ， 仅 仅 取决 于 同时 在 线 的 用 户 数量 ， 因 为 
一 个 用 户 对 应 一 个 流 。 在 组 播 环境 中 ， 服 务 器 总 带宽 使 用 率 随 着 副本 服务 器 的 数量 增 
加 而 增加 ， 因 为 用 户 请 求 被 发 往 大 量 服务 器 ， 并 且 一 个 流通 常 定向 给 更 少 的 用 户 。 

网 络 总 带宽 和 服务 器 总 带宽 不 同 ， 因 为 前 者 不 仅仅 考虑 总 传输 速率 还 要 考虑 内 容 
传递 的 距离 。 因 此 ， 在 单 播 环境 中 ， 使 用 最 短路 径路 由 算法 后 ， 网 络 总 带宽 随 着 副本 
服务 器 数量 增加 而 下 降 。 在 组 播 环境 中 ， 网 络 总 带宽 也 依赖 于 接收 每 一 个 流 的 用 户 数 
量 。 因 此 ， 即 便 一 条 路 径 很 长 ， 如 果 大 量 用 户 共享 ， 那 么 网 络 总 带宽 使 用 率 依然 会 
降低 。 

Alemida 等 人 研究 了 内 容 分 发 总 成 本 的 最 小 化 问题 ， 包 括 网 络 总 带宽 和 整体 
服务 器 带宽 ， 并 假设 使 用 组 播 流 技术 实现 从 副本 服务 器 到 用 户 的 内 容 分 发 。 他 们 的 研 
究 表明 ， 传 统 单 播 内 容 分 发 系统 的 成 本 要 远 高 于 最 优 值 。 他 们 考虑 了 如 何 确定 副本 服 
务 器 的 最 优 数量 、 副 本 服务 器 的 放置 和 请 求 路 由 的 问题 ， 解 决 这 些 问题 可 以 使 得 在 使 
用 组 播 的 系统 中 整体 成 本 接近 最 优 。Kusmierek 等 人 中 研究 了 副本 服务 器 数量 和 副本 
服务 器 放置 地 点 对 于 整个 网 络 的 影响 ， 以 及 在 借助 代理 服务 器 的 周期 性 广播 技术 的 系 
统 中 服务 器 带宽 使 用 率 的 问题 。 他 们 的 结论 表明 ， 在 只 使 用 一 台 副本 服务 器 时 ， 服 务 
器 带宽 需求 可 达到 最 小 ， 并 随 着 副本 服务 器 数量 的 增加 而 变 大 。 另 外 ， 网 络 带 宽 需求 
随 着 副本 服务 器 数量 的 增加 而 下 降 。 

可 扩展 流 技术 的 应 用 不 仅仅 影响 了 需要 确定 的 副本 服务 器 数量 ， 而 且 还 与 用 于 最 
小 化 系统 开销 的 内 容 分 配 问题 紧密 相关 。Griwodzt 研 究 了 一 种 分 层 CDN 中 的 内 容 分 
配 问题 ， 其 中 系统 使 用 组 播 和 部 分 分 发 ， 并 对 视频 片段 使 用 无 序 分 发 技术 。 作 者 得 出 
的 结论 是 ， 基 于 最 优化 成 本 的 副本 服务 器 放置 策略 ， 即 高 效 地 使 用 组 播 的 策略 有 可 能 
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将 热门 的 视频 内 容 放置 在 远离 端 用户 的 位 置 、 将 访问 量 低 的 内 容 放 置 于 端 用 户 的 附 
近 ， 从 而 影响 提供 给 用 户 的 服务 质量 。 这 种 对 服务 质量 的 负面 影响 可 以 通过 修改 成 本 
计算 和 选择 合适 的 数据 流 融合 机 制 参数 来 消除 。 

多 媒体 CDN 中 的 资源 使 用 量 在 不 同 的 时 间 尺 度 上 变化 很 大 。 具 体 而 言 ，CDN 上 
的 电视 广播 在 每 日 的 不 同时 段 呈 现 不 同 的 变化 ， 因 为 一 般 而 言 ， 用 户 在 晚间 看 电视 要 
比 早 上 多 得 多 。 给 定 多 媒体 对 象 的 典型 大 小 ， 相 对 于 Web 对 象 ， 并 发 用 户 数 的 变化 
所 导致 的 上 述 变化 的 幅度 要 高 得 多 。Cahill 等 人 "研究 了 这 样 一 个 系统 中 动态 变化 
的 资源 需求 ， 他 们 假设 CDN 运行 在 一 个 共享 网 络 而 不 是 专用 的 私有 网 络 。 因 此 ， 用 
于 内 容 分 发 的 资源 可 以 通过 从 服务 提供 商 租赁 得 到 ， 并 在 需要 时 可 以 释放 。 作 者 借 此 
提出 了 一 个 CDN 模型 ， 该 模型 并 不 包括 启动 成 本 ， 但 是 基于 一 个 假设 ， 即 在 此 模型 
中 用 于 内 容 分 发 的 副本 服务 器 的 数量 可 以 动态 改变 ， 并 使 用 了 动态 改变 的 存储 空间 和 
带宽 需求 。 

最 后 ， 多 媒体 内 容 经 常 通过 非 序列 方式 进行 访问 ， 就 像 用 户 进行 VCR 操作 那样 。 
此 类 型 的 内 容 访问 会 影响 到 内 容 分 配 。 如 果 无 法 在 每 台 副 本 服务 器 上 都 复制 整个 内 容 
HE (由 于 存储 空间 的 限制 ) ， 那 么 仅仅 存储 某 些 和 端 用 户 相关 的 特定 的 视频 片段 会 有 
助 于 内 容 分 发 。 已 有 结果 表明 ， 此 方法 能 够 降低 访问 视频 播放 目录 的 延 时 ， 并 减轻 网 
络 状 态 对 内 容 播 放 的 影响 。 使 用 VCR 之 类 的 操作 可 能 需要 对 某 些 视频 片段 进行 复 
fl) ， 从 而 允许 用 户 从 一 个 视频 片段 跳 至 另外 一 个 片段 ， 而 无 须 长 时 间 的 等 待 。 此 
方法 能 够 改善 内 容 分 发 和 用 户 请求 的 路 由 规则 。 


13.3 iTVP 平台 


本 节 通 过 描述 iTVP 平台 ,给 出 了 多 媒体 CDN 设计 的 方法 。 在 开始 讨论 iTVP F 
台 的 CDN 相关 特性 之 前 ， 首 先 给 出 iTVP 平台 的 功能 性 和 组 织 性 的 描述 。 

ITVP 是 一 个 多 媒体 分 发 平台 ， 设 计 目 的 在 于 为 任意 互联 网 用 户 提供 全 国 范围 内 
的 内 容 服务 。 该 系统 提供 如 下 相关 服务 : 实况 TV 节目 传输 、 实 况 节目 传输 的 时 间 平 
移 〈 即 时 间 条 拖 动 ) 、 视 频 点 播 、 音 频 点 播 以 及 某 些 附加 服务 ， 如 电视 节目 向 导 和 个 
人 录像 机 等 。iTVP 平台 从 多 个 独立 内 容 提供 商 处 分 发 内 容 ， 并 与 最 终 网 络 运营 商 进 
行 协同 。 内 容 以 多 种 编码 形式 分 发 并 通过 多 种 端 设备 包括 PC、 机 顶 盒 和 手持 设备 等 
获取 。 

内 容 分 发 系统 是 平台 的 核心 组 件 之 一 。 除 此 之 外 ,平台 还 包括 内 容 提 供 商 系统 、 
许可 证 管理 系统 和 一 些 交互 端口 用 做 端 用 户 的 主 访问 点 ( 见 图 13. 1) 。 内 容 提供 商 系 
统 在 CDN 中 对 应 的 是 源 服务 器 ， 它 不 仅 负责 存储 提供 商 的 所 有 内 容 ， 还 负责 内 容 纺 
码 、 元 数据 描述 、 确 认 、 颁 发 许可 证 和 内 容 分 发 。 许 可 证 管理 系统 的 设计 初衷 是 为 了 
支持 多 许可 证 的 情形 ， 以 及 与 交互 端口 协同 的 多 种 付费 方式 。 

从 功能 上 说 ，iTVP CDN 由 以 下 子 系统 组 成 : 分 配 、 监 控 、 管 理 和 报告 子 系统 。 
分 配子 系统 负责 多 媒体 内 容 的 分 配 和 分 发 ， 它 执行 内 容 缓存 和 实时 流 中 继 ， 并 负责 资 
源 管理 和 访问 控制 。 为 了 高 效 地 工作 ， 分 配子 系统 使 用 由 监控 子 系统 在 线 收集 并 处 理 
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所 得 到 的 系统 节点 参数 。 监 控 子 系统 主要 负责 实时 传递 涉及 系统 运行 状态 的 各 方面 最 
新 信息 ， 包 括 硬件 设备 性 能 数据 、 网 络 接口 参数 、 应 用 层 负 载 、 服 务 性 能 数据 和 可 用 
节点 情况 。 收 集 这 些 参 数 使 得 监控 子 系统 能 够 在 全 局 上 进行 系统 的 负载 均衡 、 故 障 检 
测 和 系统 性 能 评估 。 管 理子 系统 的 任务 是 存储 和 收集 CDN 节点 配置 、 内 部 服务 接 人 
点 、 网 络 层 的 配置 和 由 其 他 平台 组 件 〈 如 内 容 提 供 商 系统 ) 所 提供 的 外 部 服务 等 相 
关 信息 。 报 告 子 系统 收集 由 监控 子 系统 采集 并 获取 的 实时 监控 参数 ， 并 存储 系统 运行 
期 间 发 生 的 所 有 事件 ， 供 系统 性 能 分 析 使 用 。iTVP CDN 的 所 有 子 系统 是 分 布 式 的 ， 
并 被 部 署 于 所 有 系统 的 各 个 节点 处 ， 彼 此 之 间 进 行 协同 来 提供 系统 服务 。 


1) 
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图 13.1 iTVP 平 台 组 件 


从 组 织 结构 上 说 ， 内 容 分 发 主要 有 三 种 实体 参与 。 首 先 ， 需 要 有 大 量 的 独立 内 容 
提供 商 来 构成 多 媒体 内 容 的 资源 ; 第 二 种 实体 是 CDN 管理 员 ， 负 责 监控 系统 运行 ， 
这 个 角色 由 Poznan 超级 计算 机 和 网 络 中 心 〈 也 是 波兰 全 国 范围 内 所 有 光纤 主干 网 的 
管理 者 ) 来 执行 ， 称 为 PIONIER; 第 三 ， 大 量 独立 的 服务 提供 商 的 参与 ， 保 证 了 其 用 
户 能 访问 iTVP 平台 服务 。 

iTVP 平台 原型 最 早 在 2006 年 开始 进行 部 署 ， 完 整 的 功能 运行 阶段 从 2007 年 年 初 
开始 。 目 前 该 平台 正在 逐步 增加 其 节目 和 相关 服务 ， 同 时 用 户 数量 也 在 稳步 上 升 。 起 
初 ， 内 容 库 提供 数 千 种 内 容 ， 该 数字 在 2007 年 底 几乎 增加 了 一 个 数量 级 。 每 月 接收 
内 容 分 发 的 独立 IP 地 址 的 数量 从 2006 年 上 半年 的 10 万 左右 ,增长 到 2007 年 底 的 50 
余 万 。 目 前 ，iTVP 平台 有 两 个 内 容 提供 商 : 波兰 公共 电视 台 (TVP) 和 公共 广播 。 
播放 节目 包括 实况 转播 和 内 容 点 播 ， 其 中 实况 转播 可 以 同步 播放 也 可 以 预先 播放 ， 或 
者 以 专 为 互联 网 平台 准备 的 方式 播放 。 内 容 点 播 包 括 实况 内 容 的 归档 版 。 目 前 ， 内 容 
库 随 着 新 制作 节目 的 加 入 不 断 变 大 ， 同 时 也 随 着 归档 节目 的 数字 化 而 继续 增加 。 
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13.4 iTVP CDN 架构 


一 般 而 言 ， 确 定 CDN 副本 服务 器 数量 和 位 置 的 问题 可 以 通过 最 小 化 CDN 运营 成 
本 来 解决 ， 同 时 也 可 反映 出 资源 的 需求 。 不 过 ， 另 一 个 方法 是 最 优化 用 户 体 验 到 的 服 
务 质量 。 更 好 的 服务 质量 意味 着 需要 更 多 的 资源 来 进行 内 容 分 发 。 因 此 ， 这 两 个 方法 
是 相互 冲突 的 。 在 多 媒体 内 容 的 情况 下 ， 服 务 质量 与 其 他 类 型 的 内 容 在 定义 方式 上 完 
全 不 同 ， 确 保 一 定 的 服务 质量 在 多 媒体 CDN 规划 中 会 起 到 非常 重要 的 作用 。 访 问 时 
间 仅 仅 是 服务 质量 的 参数 之 一 ， 另 外 一 些 重要 因素 包括 多 媒体 播放 的 连续 性 及 由 视频 
分 辨 率 和 音频 质量 所 决定 的 多 媒体 质量 。 通 常用 户 愿意 为 打开 一 个 Web 页 面 而 等 待 
一 段 时 间 , 但 是 绝 大 多 数 用 户 都 无 法 忍受 时 断 时 续 的 视频 播放 。 因 此 ， 很 多 iTVP 
CDN 的 设计 都 是 在 服务 质量 和 分 发 成 本 之 间 进 行 均衡 ,但 至 少 必须 确保 最 低 限度 的 
服务 质量 。 


13.4.1 两 层 的 分 级 式 设计 


CDN 设计 的 第 一 步 是 副本 服务 器 数量 和 放置 的 问题 。 我 们 的 解决 方案 由 一 系列 
因素 构成 ， 其 中 最 重要 的 是 覆盖 范围 、 内 容 类 型 、 需 要 提供 的 服务 类 型 以 及 潜在 的 传 
输 网 络 拓扑 。 下 面 针 对 每 一 个 因素 进行 剖析 。 

iTVP 平台 用 来 向 全 国 范围 的 用 户 提供 服务 。 如 前 文 所 述 ， 被 选择 的 内 容 对 于 互 
联网 的 任意 用 户 都 可 访问 。 然 而 ， 内 容 分 发 系统 被 设计 用 来 主要 服务 本 国 用 户 。 在 这 
个 假设 下 ， 很 明显 ， 副 本 服务 器 应 当 被 放置 在 那些 端 用 户 高 度 聚 集 的 地 带 〈 如 大 城 
市 ) ， 并 且 在 内 容 分 发 网 络 的 拓扑 限制 下 ， 服 务 器 的 地 域 分 布 应 当 与 人 口 分 布 相 
匹配 。 

ITVP 所 提供 的 内 容 的 特性 ， 即 多 媒体 的 直播 内 容 和 点 播 内 容 ， 确 定 了 分 发 成 本 
和 存储 成 本 。 大 多 媒体 文件 的 传输 需要 占用 源 服务 器 和 副本 服务 器 之 间 的 大 量 带宽 ， 
以 及 副本 服务 器 和 端 用 户 之 间 的 大 量 带 宽 。 将 副本 服务 器 放置 到 用 户 附近 能 够 极 大 地 
降低 与 带宽 相关 的 分 发 成 本 。 然 而 ， 此 方法 却 增加 了 副本 服务 器 的 数量 ， 并 会 导致 
CDN 内 的 分 发 成 本 和 存储 成 本 增加 。 因 此 ， 在 确定 源 服务 器 和 副本 服务 器 之 间 的 距 
离 时 ， 应 当 保证 分 配 带宽 、 分 发 带宽 和 存储 成 本 之 间 的 均衡 ， 以 使 整体 成 本 最 小 化 。 

除非 文件 下 载 模式 对 于 给 定 内 容 可 行 ， 并 且 用 户 选择 了 文件 下 载 模式 ， 否 则 需要 
点 播 的 内 容 就 通过 流 模式 分 发 给 用 户 。 内 容 流 技术 降低 了 终端 系统 的 访问 时 间 和 存储 
需求 ， 但 是 对 网 络 提出 了 严格 要 求 ， 如 可 用 带宽 和 延 时 抖动 问题 等 。 因 此 ， 具 有 一 定 
服务 质量 的 边缘 分 发 ， 如 由 处 于 主干 网 边缘 的 服务 器 进行 的 内 容 分 发 ， 在 技术 上 还 难 
以 实现 ， 并 在 经 济 上 也 不 划算 。 一 个 能 够 避免 以 上 内 容 流 问题 的 最 优 方式 就 是 将 广 域 
网 排除 在 分 发 路 径 之 外 ， 即 使 用 放置 在 本 地 接 人 网 的 服务 器 来 将 内 容 以 流 的 方式 直接 
传 给 端 用 户 。 这 样 的 方式 能 够 和 最 终 的 接 入 运营 商 (如 ISP) 一 起 协同 实现 。ISP 参 
与 内 容 分 发 的 直接 目的 在 于 确保 用 户 具 有 更 好 的 服务 质量 ， 并 降低 输入 流量 的 带宽 
成 本 。 
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以 上 的 讨论 导致 了 一 个 两 层 结构 的 分 级 式 CDN 架构 供 iTVP 平台 使 用 。CDN 架构 
的 组 件 如 图 13.2 所 示 ， 在 下 面 的 内 容 中 将 逐步 介绍 这 些 组 件 。 上 层 的 节点 是 副本 服 
务 器 ( 称 为 缓存 ) ， 放 置 在 全 国 所 有 的 战略 性 地 点 。 下 层 节点 是 代理 服务 器 /缓存 ， 
被 放置 在 不 同 的 ISP 网 络 中 ， 并 直接 向 端 用 户 提供 服务 以 确保 满意 的 服务 质量 。 上 层 
节点 的 引入 能 够 降低 与 带宽 相关 的 分 配 成 本 和 源 服务 器 负载 。 在 两 级 架构 中 ， 通 过 内 
容 提 供 商 的 数据 库 〈 如 源 服务 器 ) 获得 的 内 容 将 被 送 至 缓存 节点 ， 再 从 缓存 处 被 送 
至 代理 服务 器 /缓存 并 继续 传递 至 端 用 户 。 我 们 随后 会 看 到 ， 还 有 其 他 可 用 的 分 发 路 
径 。 为 了 使 路 径 之 间 彼 此 区 分 ,我 们 定义 CDN 中 所 有 从 源 服务 器 至 代理 服务 器 /缓存 
的 内 容 传 输 称 为 内 容 分 配 (content distribution) ， 从 缓存 /代理 服务 器 到 端 用 户 的 这 最 
后 一 步 内 容 传输 称 为 内 容 分 发 (content delivery) 。 这 样 ， 就 可 以 通过 上 述 定 义 将 分 配 
成 本 和 分 发 成 本 区 别 开 来 。 
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图 13.2 iTVP CDN 架构 


内 容 一 般 是 以 流 模式 传递 给 端 用户 。 然 而 ， 流 仅仅 发 生 在 代理 服务 器 /缓存 到 端 
用 户 的 这 一 段 ， 并 不 包括 所 有 分 配 路 径 上 的 实时 传输 ， 从 CDN 到 代理 服务 器 /缓存 的 
内 容 点 播 的 分 发 以 文件 下 载 模式 执行 。 下 一 节 将 在 描述 内 容 分 配 和 分 发 规则 的 同时 来 
验证 该 方法 。 因 此 ， 我 们 并 未 使 用 可 扩展 的 内 容 流 技术 ， 而 考虑 的 是 单 播 内 容 分 发 模 
型 中 与 服务 器 数量 相关 的 系统 开销 ， 具 体 而 言 ， 与 网 络 带宽 相关 的 分 配 开销 随 着 副本 
服务 器 的 数量 增加 而 降低 ， 内 容 分 发 所 需要 的 服务 器 带宽 并 不 取决 于 服务 器 的 数量 ， 
而 存储 成 本 随 着 服务 器 数量 增加 而 增加 。 


13.4.2 CDN 节点 放置 


对 于 副本 服务 器 的 托管 而 言 ， 城 域 网 凭借 其 连接 性 和 带宽 的 可 用 性 是 一 个 良好 的 
潜在 放置 地 点 。 一 台 副 本 服务 器 可 以 托管 多 个 缓存 服务 器 ， 它 们 都 被 与 此 副本 服务 器 
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站 点 相连 的 代理 服务 器 /缓存 和 与 其 他 副本 服务 器 放置 点 的 节点 视 为 一 个 更 高 级 的 组 
存 池 。 因 此 ， 从 现在 开始 我 们 在 iTVP 术语 表 中 使 用 “副本 服务 器 ", 或 者 “区 域内 
容 中 心 (RCC) ”来 指 一 个 作为 缓存 集群 的 副本 服务 器 站 点 。 在 一 个 副本 服务 器 处 放 
置 多 个 缓存 能 够 增加 可 用 资源 〈 主 要 指 服务 器 带宽 和 存储 能 力 ) ， 并 提高 服务 器 的 可 
靠 性 。 

代理 服务 器 /缓存 的 数量 取决 于 与 CDN 协作 的 ISP 数量 ， 每 一 个 ISP 可 以 拥有 多 
个 代理 服务 器 /缓存 ， 这 取决 于 ISP 的 网 络 大 小 〈 指 潜在 用 户 的 数量 ) 。 无 论 网 络 大 
小 ， 为 可 靠 性 起 见 ， 一 般 推荐 至 少 需 要 两 个 代理 服务 器 /缓存 。 为 了 最 小 化 分 配 成 本 ， 
代理 服务 器 /缓存 与 核心 网 络 拓扑 架构 中 距离 最 近 的 副本 服务 器 相连 。 

一 个 副本 服务 器 站 点 和 所 有 与 该 站 点 相连 的 代理 服务 器 /缓存 组 成 了 一 个 区 域 。 
区 域 的 运作 并 不 与 任何 中 心 实体 协同 工作 。 每 一 个 区 域 都 有 一 个 区 域 管理 器 并 具有 一 
定 的 自由 度 。 然 而 ， 对 区 域 进行 管理 时 需要 意识 到 其 他 区 域 的 存在 ， 并 彼此 之 间 相 互 
协作 来 执行 内 容 分 配 任务 。 内 容 可 以 从 一 个 区 域 被 分 配 到 另外 一 个 区 域 ， 但 是 只 能 在 
这 个 分 层 架构 的 高 层 中 〈 如 缓存 之 间 ) 进行 。 低 层 节点 之 间 的 协同 只 能 在 一 个 ISP 网 
络 的 内 部 节点 中 进行 ， 另 外 ， 代 理 服务 器 /缓存 只 能 通过 自己 所 处 区 域内 的 副本 服务 
器 获得 内 容 。 

随 着 系统 扩张 ， 新 的 站 点 需要 加 入 以 便 在 全 国 范围 内 进行 更 好 的 服务 ， 并 均衡 
CDN 内 部 的 网 络 流量 和 增加 整体 缓存 空间 。 新 的 副本 服务 器 的 放置 地 点 由 网 络 拓扑 、 
网 络 流量 的 分 析 和 CDN 的 运行 参数 决定 。 考 虑 到 新 的 副本 服务 器 的 放置 地 点 ， 一 些 
代理 服务 器 /缓存 可 能 需要 被 重新 分 配 到 新 的 区 域 去 ， 新 的 代理 服务 器 /缓存 也 有 可 能 
加 入 。 服 务 器 站 点 数量 的 增加 会 使 得 网 络 带宽 的 相关 分 配 成 本 降低 ， 因 为 代理 服务 
器 /缓存 和 缓存 之 间 的 距离 被 拉 近 了 。 源 服务 器 的 带宽 请 求 并 没有 增加 ， 原 因 在 于 副 
本 服务 器 站 点 之 间 彼 此 协作 。 一 台 副 本 服务 器 可 以 通过 另外 一 台 副 本 服务 器 获得 内 
容 ， 而 不 需要 通过 源 服 务 器 进行 。 新 的 副本 服务 器 站 点 的 放置 部 分 取决 于 网 络 的 拓扑 
结构 。 


13.4.3 网 络 层 配置 


内 容 分 配 是 通过 PIONIER 进行 的 ”，PIONIER 是 一 个 波兰 全 国 范围 的 基于 密集 
型 光波 复 用 (Dense Wavelength Division Multiplexing, DWDM) 技术 的 全 光 网 络 (all - 
optical network) 。PIONIER 与 21 个 城 域 网 相连 ， 这 些 城 域 网 都 是 托管 副本 服务 器 的 洪 
在 地 点 〈 见 图 13.3) 。 缓 存 集合 包含 通过 千 兆 级 以 太 网 技术 与 PIONIER 设施 相连 的 节 
点 ， 并 使 用 1Gbivs 的 通道 专用 于 传输 CDN 流量 。ISP 网 络 中 放置 的 代理 服务 器 /缓存 
通过 100 ~ 400Mbit/s 专用 通道 与 副本 服务 器 相连 。 内 部 CDN 通信 层 和 内 容 分 发 层 相 
互 连 接 ， 形 成 一 个 用 于 CDN 运行 的 虚拟 网 。 虚 拟 局 域 网 (VLAN) 使 涉及 CDN 的 流 
量 和 其 他 网 络 中 的 应 用 操作 区 别 开 ， 提 供 了 更 好 的 服务 质量 和 高 级 别 的 内 容 分 发 安全 
性 ， 这 一 点 对 于 多 媒体 行业 来 说 非常 重要 。 
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图 13.3 PIONIER 的 拓扑 


13.5 ”内容 的 分 配 和 分 发 


CDN 的 性 能 不 仅仅 取决 于 副本 服务 器 的 数量 和 位 置 ， 如 CDN 配置 的 问题 ， 它 还 
取决 于 内 容 分 配方 面 。 内 容 如 何 存储 在 CDN 中 ， 以 及 存储 在 多 少 可 用 位 置 的 相关 决 
定 都 会 影响 存储 空间 组 件 方面 的 整体 成 本 和 用 户 感 受到 的 服务 质量 。 本 节 解 释 CDN 
内 容 分 配 和 分 发 的 设计 思路 ， 读 者 需要 具备 前 面 章 节 提 及 的 iTVP CDN 拓扑 的 相关 
知识 。 


13.5.1 内 容 分 配 模 式 


在 iTVP CDN 中 ， 制 定 内 容 分 配 规则 基于 以 下 假设 : 用 户 从 其 ISP 网 络 内 放置 的 
代理 服务 器 /缓存 中 获取 内 容 ， 因 为 代理 服务 器 /缓存 直接 向 端 用 户 提供 内 容 ， 而 源 服 
务 器 和 副本 服务 器 都 是 不 可 见 的 。 每 一 个 请 求 的 对 象 都 必须 存在 于 这 些 代理 服务 器 / 
缓存 中 的 至 少 一 台 服 务 器 上 ， 假 设 用 户 从 一 个 节点 处 获得 一 个 完整 的 内 容 。 在 内 容 播 
放 过 程 中 切换 到 其 他 代理 服务 器 /缓存 处 的 情况 极为 少见 ， 仅 仅 出 现在 存在 节点 故障 
时 。 存 储 在 一 个 ISP 网 络 内 的 代理 服务 器 /缓存 处 的 一 组 对 象 主要 由 用 户 请 求 决定 ， 
与 标准 的 缓存 系统 一 样 。 因 此 ， 内 容 副 本 的 数量 和 它们 在 CDN 中 ISP 网 络 层 的 放置 
地 点 也 取决 于 用 户 请 求 。 一 般 来 说 ， 每 一 个 内 容 都 存储 在 一 个 ISP 网 络 内 预先 定义 好 
数量 的 代理 服务 器 /缓存 处 。 目 前 ， 该 数字 设置 为 2， 即 两 个 节点 。 

ITVP CDN 的 内 容 分 配 可 以 被 视 为 内 容 缓存 和 内 容 复制 的 集成 。 内 容 在 缓存 未 命 
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中 的 情况 下 ， 即 在 ISP 网 络 内 任何 代理 服务 器 /缓存 处 都 无 法 获得 该 内 容 的 情况 下 ， 
由 用 户 启 动 拉 取 模 式 来 将 内 容 分 配 至 代理 服务 器 /缓存 处 。 另 外 ， 一 个 推送 模式 也 可 
以 被 一 个 内 容 提 供 商 或 者 CDN 运营 者 启动 ， 并 在 一 个 新 内 容 被 分 发 或 者 提供 商 预 计 
对 该 内 容 的 访问 量 会 很 大 时 使 用 ， 另 外 也 在 内 容 的 流行 度 因 时 间 变 化 而 增加 的 情况 下 
使 用 。 推 送 模式 下 的 内 容 分 配 或 复制 的 目的 在 于 降低 缓存 未 命中 的 几率 ， 并 由 此 减少 
内 容 访问 时 间 。 拉 取 模 式 下 的 内 容 分 配 ， 会 调整 内 容 可 用 度 以 便 匹 配 内 容 访问 量 。 访 
问 量 大 的 内 容 会 存储 在 大 量 节 点 处 ， 访 问 量 小 的 内 容 可 能 仅仅 存在 于 少量 代理 服务 
器 /缓存 处 。 每 一 个 代理 服务 器 /缓存 都 使 用 一 个 存储 空间 ， 供 内 容 缓存 和 内 容 复制 同 
时 使 用 。 这 种 内 容 分 配 的 解决 方案 允许 CDN 将 不 同方 法 的 优势 进行 结合 。 

因为 iTVP 平台 提供 的 内 容 特性 ， 代 理 服务 器 /缓存 无 法 长 期 存储 所 有 被 请 求 或 者 
复制 的 内 容 。 因 此 需要 管理 存储 空间 ， 以 确保 高 命中 率 以 及 确保 由 于 缺少 存储 空间 导 
致 的 服务 拒绝 事件 不 会 发 生 。 缓 存 内 容 的 替换 策略 可 以 被 描述 为 一 种 改进 的 LRU 算 
法 。 修 改过 程 考虑 了 内 容 大 小 ， 因 为 相对 于 访问 量 不 高 的 大 文件 而 言 ， 一 个 访问 量 高 
的 小 对 象 可 以 考虑 被 优先 替换 。 对 内 容 大 小 的 考虑 降低 了 分 配 中 的 带宽 使 用 成 本 ， 这 
对 于 大 文件 而 言 非 常 重要 。 对 于 给 定 内 容 的 分 配 模式 〈 如 缓存 或 复制 ) ， 在 内 容 替 换 
的 选择 中 并 未 加 以 考虑 。 因 为 替换 过 程 非常 消耗 系统 资源 ， 需 要 定期 执行 并 将 存储 空 
间 释 放 到 一 个 预先 定义 好 的 大 小 。 蔡 换 频率 的 选择 和 将 存储 空间 释放 到 何 种 程度 对 
CDN 的 性 能 有 极 大 影响 。 释 放 过 多 空间 会 增加 分 配 成 本 和 缓存 未 命中 的 几率 ， 相 反 
如 果 存储 空间 释放 不 够 会 导致 服务 被 拒绝 。 

代理 服务 器 /缓存 需要 从 它们 所 在 区 域 的 高 一 级 节点 处 获取 内 容 。 分 配给 某 一 给 
定 副本 服务 器 站 点 的 内 容 被 存储 在 至 少 一 个 缓存 服务 器 处 。 为 了 最 小 化 存储 需求 ， 每 
一 个 内 容 只 能 存储 在 一 个 区 域内 的 一 个 缓存 服务 器 处 ， 这 也 是 iTVP CDN 中 的 现行 策 
略 。 一 个 区 域内 位 于 高 一 层 的 内 容 副本 数量 如 果 多 于 1 个 ， 会 提高 服务 的 可 靠 性 并 增 
加 服务 器 的 可 用 带宽 ; 但 这 样 做 无 形 中 增加 了 存储 成 本 。 因 此 ， 缓 存 处 存储 的 内 容 副 
本 数量 的 选择 被 用 于 平衡 存储 成 本 和 带宽 成 本 。 通 过 源 服务 器 或 男 一 个 副本 服务 器 的 
缓存 ， 内 容 被 分 配 到 缓存 服务 器 。CDN 区 域 通过 推送 和 拉 取 的 方式 与 内 容 分 配 协 作 ， 
这 就 实现 了 协作 式 的 内 容 复制 和 缓存 。 这 种 协作 方式 更 进一步 降低 了 源 服 务 器 的 负载 
和 分 配 成 本 。 代 理 服务 器 /缓存 之 间 的 协作 被 限定 在 一 个 ISP 网 络 内 的 一 组 节点 上 。 
一 个 ISP 网 络 没有 理由 为 另外 一 个 ISP 网 络 提供 内 容 。 在 一 个 ISP 网 络 内 部 ， 内 容 可 
以 从 一 个 代理 服务 器 /缓存 处 分 配 到 另外 一 个 代理 服务 器 /缓存 处 , 但 是 这 样 的 传输 会 
增加 代理 服务 器 /缓存 的 负载 ， 并 影响 端 用 户 的 服务 质量 。 对 副本 服务 器 站 点 的 存储 
空间 管理 方式 类 似 于 代理 服务 器 /缓存 空间 管理 ， 一 种 情况 除外 ， 即 前 者 的 缓存 替换 
过 程 不 是 定期 进行 ， 而 是 当 需 要 释 放 存 储 空间 时 才 进行 。 


13.5.2 内 容 传输 模式 


点 播 内 容 通过 文件 形式 进行 分 配 ， 播 放 速度 一 般 要 比 从 源 服 务 器 一 路 到 代理 服务 
器 /缓存 的 方式 快 得 多 。 流 仅仅 用 于 从 代理 服务 器 /缓存 到 端 用 户 的 内 容 分 发 。 直 播 内 
容 《〈 如 直播 电视 节目 ) 是 通过 内 容 提供 商 的 服务 器 以 流 的 方式 传递 到 副本 服务 器 ， 并 
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通过 副本 服务 器 中 继 到 其 他 副本 服务 器 。 每 一 个 区 域内 服务 器 中 的 副本 通过 中 继 的 方 
式 将 流传 递 到 代理 服务 器 /缓存 ， 而 代理 服务 器 /缓存 接着 将 内 容 流传 递 到 端 用 户 。 因 
此 ， 直 播 内 容 的 分 配 可 以 被 视 为 应 用 层 的 组 播 ， 与 CDN 节点 一 起 形成 了 一 个 覆盖 网 。 
对 点 播 内 容 使 用 文件 模式 分 配 有 多 种 好 处 。 因 为 文件 模式 分 配 高 传输 速度 的 特性 ， 使 
得 整个 内 容 能 更 快 地 以 流 的 形式 分 配 ， 因 此 允许 用 户 能 执行 VCR 之 类 的 操作 。 因 为 
流 仅仅 发 生 在 ISP 网 络 内 部 ， 因 此 提供 给 用 户 的 服务 质量 不 会 取决 于 CDN 内 的 网 络 
条 件 。 男 外 ， 文 件 模 式 分 配 的 流量 模型 要 比 流 模 式 简单 得 多 ， 能 够 极 大 地 简化 网 络 带 
宽 管理 。 有 两 种 机 制 可 以 进一步 减少 内 容 访问 时 间 。 首 先 ， 使 用 CDN 分 层 机 制 的 分 
配 可 通过 直通 或 者 管道 方式 进行 ， 即 从 源 服务 器 到 一 台 副 本 服务 器 (或 两 台 副 本 服 
务 器 之 间 ) 的 传输 与 副本 服务 器 到 代理 服务 器 /缓存 之 间 的 传输 是 并 行 完 成 的 。 直 通 
式 分 配 限 制 了 分 配 路 径 长 度 对 于 分 配 时 间 的 影响 。 其 次 ， 代 理 服 务 器 /缓存 到 用 户 的 
流 可 以 通过 所 谓 的 快速 启动 模式 进行 ， 其 中 视频 文件 并 不 是 一 定 要 等 到 全 部 传 完 后 才 
能 播放 ， 而 是 当 达到 所 需 最 小 信息 量 时 即 可 启动 流 ， 这 个 时 间 要 远 小 于 整个 文件 传输 
完成 所 需要 的 时 长 。 从 用 户 的 角度 来 看 ， 快 速 启动 模式 使 得 内 容 分 配 所 需 的 时 间 
( 即 启动 内 容 流 的 时 间 ) 与 内 容 的 大 小 无 关 。 


13.5.3 瞬时 拥塞 处 理 


CDN 系统 中 的 一 个 重要 功能 就 是 具有 处 理 瞬时 阻塞 的 能 力 "” 。 发 布 一 个 被 大 量 
用 户 感 兴趣 的 内 容 很 容易 地 导致 用 户 请 求 访问 量 在 短 时 间 内 迅速 升 高 ， 并 因此 使 同时 
在 线 的 用 户 数量 激增 ， 这 样 的 情形 对 于 用 户 感 兴趣 事件 的 实况 转播 而 言 很 常见 。 一 般 
而 言 ， 这 种 内 容 的 传输 需要 提前 规划 ， 同 时 内 容 分 配 也 需要 在 事件 开始 前 就 执行 。 如 
果 事 先 没 有 料 到 用 户 请 求 数量 的 激增 ， 那 么 开始 的 少量 请 求 会 使 内 容 被 分 配 到 大 量 的 
代理 服务 器 /缓存 中 去 ， 以 源 服 务 器 为 根 节点 的 内 容 分 配 树 将 快速 建立 起 来 。 因 为 管 
道内 容 传输 和 快速 启动 模式 的 原因 ， 从 代理 服务 器 /缓存 开始 的 内 容 流 可 以 在 很 短 时 
间 内 迅速 启动 。 后 继 的 用 户 请 求 会 被 分 散 到 所 有 可 用 的 代理 服务 器 /缓存 ， 此 时 该 内 
容 已 经 可 以 从 代理 服务 器 /缓存 中 获取 。 区 域 管理 器 需要 具备 很 高 的 请 求 处 理 吞 吐 能 
力 ， 因 为 所 有 关于 路 由 的 信息 都 可 在 本 地 获取 。 


13.6 用户 请 求 路 由 


用 户 请 求 路 由 是 CDN 的 一 个 功能 ， 用 于 完善 CDN 拓扑 和 内 容 分 配 策略 。 至 于 选 
择 哪 个 节点 能 够 将 内 容 提供 给 用 户 的 规则 ， 则 部 分 地 由 CDN 拓扑 和 可 用 内 容 决定 。 
一 般 而 言 ， 会 有 一 个 节点 集合 用 于 向 特定 用 户 提供 服务 。 从 请 求 路 由 方法 的 角度 来 
说 ， 多 媒体 内 容 在 此 方面 需要 与 其 他 类 型 的 内 容 区 分 开 来 。 当 流 分 发 的 网 络 需求 确定 
后 ， 分 发 路 径 参 数 是 节点 选择 过 程 中 最 重要 因素 之 一 ， 仅 次 于 服务 器 负载 。 这 些 参 数 
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不 仅 包 括 需要 传输 的 距离 ， 而 且 还 包括 可 用 带宽 和 延 时 抖动 等 。 在 本 节 列 出 关于 
iTVP CDN 节点 的 选择 标准 ， 并 描述 用 于 用 户 请 求 路 由 的 机 制 。 


13. 6.1 节点 选择 标准 


对 于 一 个 通过 他 地 址 来 识别 的 用 户 ， 有 多 种 标准 可 以 用 来 确定 由 哪个 节点 向 该 
用 户 提供 服务 ， 包 括 用 户 相对 于 代理 服务 器 /缓存 的 位 置 、 内 容 可 用 性 、 节 点 负载 。 
节点 选择 策略 首先 通过 主 标准 选择 出 一 组 能 够 向 给 定 用 户 提供 服务 的 节点 ， 并 通过 第 
二 个 标准 从 该 表 中 筛选 ， 直 至 一 个 预先 定义 好 的 节点 数量 。 

能 够 向 给 定 用 户 提供 服务 的 节点 的 初始 集合 通过 用 户 的 IP 地 址 和 耳 子 网 与 代理 
服务 器 /缓存 之 间 的 映射 决定 。 该 映射 反映 了 某 些 ISP 网 络 中 用 户 的 所 在 地 点 。IP 子 
网 与 代理 服务 器 /缓存 之 间 的 映射 根据 与 CDN 合作 的 ISP 列表 创建 。 除 了 在 不 同 ISP 
网 络 中 放置 的 代理 服务 器 /缓存 之 外 ， 还 存在 一 些 代理 服务 器 /缓存 能 够 给 任意 互联 网 
用 户 提供 服务 。 这 些 代理 服务 器 /缓存 与 主干 网 相连 或 者 与 1Gbit/s 通道 的 城 域 网 相 
连 。 相 对 于 ISP 网 络 中 被 指定 的 节点 而 言 ， 它 们 被 称 为 默认 代理 服务 器 /缓存 ， 其 存 
在 的 目的 是 向 不 属于 与 iTVP 平台 相关 的 任何 ISP 中 的 用 户 提供 访问 TVP 的 服务 ， 并 
提供 这 些 用 户 所 在 的 ISP 中 的 代理 服务 器 /缓存 中 无 法 获取 的 内 容 的 访问 服务 。 后 者 
的 角色 是 在 出 现 缓存 未 命中 时 ， 能 够 降低 用 户 访问 时 间 。 如 果 用 户 请 求 的 内 容 位 于 任 
意 一 台 默 认 代理 服务 器 /缓存 上 ， 用 户 请 求 就 会 被 路 由 至 此 代理 服务 器 /缓存 处 ， 同 时 
内 容 分 发 开始 转 至 被 指定 的 代理 服务 器 / 缓 在。 因此， 一 般 而 言 通过 用 户 IP 地 址 所 先 
择 出 来 的 节点 集 包含 两 种 服务 器 ， 即 指定 的 和 默认 的 代理 服务 器 /缓存 服务 器 。 

考虑 到 在 ISP 网 络 中 可 能 存在 多 于 一 台 的 代理 服务 器 /缓存 ， 节 点 选择 的 第 二 个 
标准 是 请 求 内 容 的 可 用 性 。 这 种 方法 能 够 最 小 化 内 容 访问 时 间 ， 并 降低 分 发 开销 。 内 
容 可 用 性 或 内 容 定位 通过 在 每 一 个 区 域内 维护 的 内 容 目录 中 存储 的 信息 决定 。 因 此 ， 
任何 内 容 都 可 以 通过 一 份 区 域内 目录 查找 表 来 进行 快速 定位 。 每 一 个 区 域 管理 器 负责 
维护 该 内 容 目录 表 ， 同 时 为 其 他 区 域 充当 目录 服务 器 。 快 速 内 容 查找 所 产生 的 成 本 很 
大 程度 上 与 目录 更 新 系统 成 本 有 关 。 然 而 ， 区 域 管理 器 会 管理 所 有 节点 的 运行 ， 包 括 
内 容 分 配 。 因 此 ， 大 多 数 内 容 定位 更 新 随 内 容 分 配 而 进行 ， 这 样 自身 不 会 增加 通信 系 
统 成 本 。 从 一 个 节点 上 移 除 内 容 所 导致 的 缓存 替换 过 程 不 会 显著 增加 系统 成 本 。 一 个 
中 心 内 容 目录 (或 中 心 管理 器 ) 可 能 发 生 单 点 失效 ， 这 被 认为 是 此 类 解决 方案 中 最 
严重 的 缺陷 。 为 了 确保 可 靠 性 ， 一 般 每 个 CDN 副本 服务 器 中 配备 有 至 少 两 个 缓存 服 
务 器 ， 能 够 负责 接管 内 容 目录 服务 器 的 任务 和 实现 管理 器 的 职责 ， 这 样 就 能 够 确保 对 
管理 区 域 而 言 至 关 重要 的 数据 不 会 在 管理 系统 出 现 故障 时 丢失 。 

在 所 有 能 够 向 用 户 提供 服务 的 节点 中 ， 请 求 内 容 能 够 得 到 满足 的 节点 将 被 选 定 。 
如 果 存在 多 于 一 个 节点 符合 以 上 条 件 ， 那 么 负载 最 小 的 代理 服务 器 /缓存 ( 如 满足 最 
小 数量 的 在 线 用 户 要 求 ) 将 被 优先 选择 成 为 指定 的 代理 服务 器 /缓存 。 考 虑 到 端 用 户 
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和 给 定 ISP 网 络 中 确定 的 每 一 个 代理 服务 器 /缓存 之 间 的 静态 路 径 特性 彼此 相似 ， 并 
考虑 到 动态 特性 取决 于 负载 ， 同 时 在 线 用 户 的 数量 反映 了 服务 器 负载 和 可 用 带宽 。 更 
精确 地 说 ， 考 虑 到 可 靠 性 ， 可 用 节点 的 数量 被 缩减 为 大 于 1 台 即 可 ， 一 般 而 言 是 两 
个 。 也 就 是 说 ， 用 户 同时 收 到 两 个 地 址 来 对 其 请 求 的 内 容 进 行 服务 。 如 果 没 有 任何 节 
上 扩 〈( 其 至 包括 默认 代理 服务 器 /缓存 在 内 ) 能 满足 用 户 请 求 ， 那 么 会 出 现 一 个 缺失 信 
号 并 启动 内 容 分 配 。 


13.6.2 请 求 重 定向 机 制 


区 域 管理 器 负责 选择 节点 和 确定 用 户 请 求 路 由 。 然 而 ， 用 户 并 不 与 管理 器 直接 交 
互 。 对 于 端 用 户 来 说 ， 有 很 多 独立 人 口 能 够 确保 用 户 与 iTVP 服务 相连 。 一 个 用 户 请 
求 通过 一 个 人 口 被 定向 到 一 个 区 域 管理 器 供 后 期 处 理 使 用 ， 如 用 于 代理 服务 器 /缓存 
选择 。IP 子 网 和 代理 服务 器 /缓存 之 间 的 映射 转变 为 中 子 网 和 CDN 区 域 之 间 的 映射 。 
因此 ， 对 于 一 个 给 定 用 户 的 下 地址， 应 当 存 在 一 个 区 域 能 够 为 该 用 户 提 供 相关 服务 ， 
并 且 区 域 管理 器 收 到 请 求 后 ， 能 够 将 其 转发 到 一 个 合适 的 区 域 。 因 为 在 用 户 获得 访问 
内 容 服 务 时 ， 入 口 充 当 了 端 用 户 和 CDN 之 间 的 中 介 ， 所 以 区 域 管 理 器 对 于 请 求 的 响 
应 会 通过 入 口 被 送 回 。 该 响应 可 以 是 一 个 包含 代理 服务 器 /缓存 地 址 的 响应 ， 也 可 以 
是 一 个 因为 缓存 未 命中 所 返回 的 “等 待 ”响应 。 


13.7 iTVP CDN 性 能 评估 


基于 CDN 报告 子 系统 收集 到 的 数据 ， 可 以 计算 一 系列 指标 ， 用 于 对 CDN 性 能 和 
用 户 感 知 到 的 服务 质量 进行 评估 。 首 先 ， 介 绍 系统 配置 、 主 要 内 容 提供 商 的 内 容 库 以 
及 在 数据 收集 期 间 观测 到 的 CDN 负载 情况 。 其 次 ， 通 过 检查 下 面 三 个 方面 的 信息 ， 
即 在 不 同 CDN 层 和 相应 数据 库 之 间 分 配 的 对 象 数量 、 低 层 节点 所 用 带宽 引发 的 分 配 
成 本 以 及 CDN 节点 使 用 的 缓冲 空间 所 对 应 的 存储 成 本 ， 来 衡量 内 容 分 配 的 成 本 。 
CDN 性 能 也 通过 用 户 感 知 到 的 服务 质量 (用 请 求 命中 率 来 表示 ) 来 进行 衡量 。 


13.7.1 iTVP CDN 配置 


在 iTVP CDN 的 现 有 配置 中 ， 有 两 台 副 本 服务 器 运行 在 Poznan 和 Krakow 两 地 ， 
大 量 的 代理 服务 器 /缓存 分 布 在 不 同 的 城市 中 : Warszawa, Poznan, Gdansk, Szczecin 
等 城市 连接 到 Poznan 区 域 ，Krakow、Lodz、Katowice 等 城市 连接 到 Krakow 区 域 。 
ITVP 内 容 库 的 源 服务 器 位 于 Warszawa， 并 同时 和 两 台 副 本 服务 器 相连 ， 如 图 13.4 所 
示 。 缓 存 节点 和 默认 代理 服务 器 /缓存 配置 了 大 小 为 TB 级 的 缓存 空间 ， 指 定 的 代理 
服务 器 /缓存 的 缓存 空间 一 般 为 400CB 左右 。 
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图 13.4 iTVP CDN 的 配置 


13.7.2 内 容 库 特性 


内 容 库 中 的 媒体 内 容 以 MPEG4 兼容 格式 进行 编码 (Window 媒体 ) 。 大 多 数 对 象 
都 有 两 种 质量 格式 可 供 选 择 ， 一 种 主要 针对 传输 速度 28 ~ 128kbit/s 的 手持 设备 进行 
编码 ， 另 外 一 种 主要 以 160 ~ 700kbit/s 的 传输 速率 进行 编码 。 部 分 内 容 以 更 高 的 
1. SMbit/s 速率 进行 编码 ， 需 要 下 载 的 内 容 也 以 1. 5Mbit/s 的 速率 进行 编码 。 每 一 种 质 
量 格式 的 编码 在 给 定 速率 区 间 内 都 含有 多 种 流 ， 可 供 不 同 的 带宽 情况 选用 (多 速率 
CBR), 。 低 质量 的 格式 包括 3 ~4 个 视频 流 ， 速 率 范围 从 16kbit/s S] M1 kbit/s, DAI ~ 
3 个 音频 流 ， 速 率 范 围 从 8kbit/s 到 20kbit/s。 更 高 的 质量 内 容 格 式 一 般 包 括 
4 ~5 个 视频 流 ， 速 率 从 121kbit/s 到 563kbit/s 不 等 ， 并 包括 3 ~4 个 音频 流 ， 速 率 从 
20kbit/s 至 128kbit/s。 图 13. 5 给 出 了 点 播 内 容 大 小 的 累积 分 布 函数 (CDF), KER 
文件 都 含有 数 百 MB 的 数据 ， 确 切 地 说 有 46% 的 数据 对 象 大 于 100MB。 

iTVP CDN 每 日 发 布 的 对 象 数量 一 般 在 几 十 个 左右 。 有 些 新 闻 节 目 会 在 一 天 中 播 
放 多 次 ， 并 且 在 实况 直播 之 后 会 有 存档 版 本 立刻 上 线 供 点 播 访问 。 这 样 的 内 容 一 般 仅 
仅 在 接 下 来 的 几 周 内 被 访问 。 因 此 ， 这 样 的 节目 分 发 率 并 不 影响 内 容 提 供 商 的 内 容 库 
中 可 供用 户 访问 的 内 容 对 象 的 整体 数量 。 
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13.7.3 CDN 负载 


多 媒体 CDN 的 负载 可 能 由 多 个 因素 决定 ， 如 用 户 数 量 、 用 户 访问 量 、 视 频 内 容 
播放 的 总 时 间 及 平均 时 间 ， 以 及 端 用 户 能 接触 到 的 数据 量 大 小 等 。 我 们 定义 用 户 数量 
为 发 送 请 求 并 收 到 内 容 的 独立 IP 地 址 的 数量 ， 这 个 数字 应 被 视 为 真正 用 户 的 数量 下 
限 。 不 过 ， 我 们 正 设法 提出 对 该 用 户 数量 更 加 精确 的 测量 方法 。 我 们 观察 到 ， 用 户 数 
量 的 快速 增长 (每 月 以 数 十 万 计 ) 与 所 提供 的 服务 的 提升 成 正比 关系 。 用 户 访问 量 
也 在 快速 增长 ， 每 月 超过 上 百 万 ， 这 说 明 大 多 数 用 户 是 回头 客 。 一 个 月 内 媒体 内 容 播 
放 的 总 时 间 大 约 在 数 百 个 播放 年 的 数量 级 ， 每 一 个 会 话 期 都 在 10 多 分 钟 左右 。 大 多 
数 iTVP 媒体 内 容 都 有 较 长 的 播放 持续 时 间 ， 这 样 的 情况 在 互联 网 上 很 少见 。 送 往 端 
用 户 的 数据 大 小 主要 取决 于 内 容 编码 质量 和 可 用 带宽 。 因 为 这 些 参数 都 在 稳步 提高 ， 
因此 我 们 每 个 月 能 给 端 用 户 提供 数 百 TB 的 数据 ， 这 个 数字 还 在 增长 。 

CDN 的 负载 也 受 播放 媒体 内 容 时 在 线 用 户 数量 的 影响 。 同 时 在 线 的 用 户 数量 随 
着 时 间 变 化 剧烈 ， 每 天 的 不 同时 段 和 每 周 的 不 同日 期 都 与 用 户 数 存在 着 一 定 的 对 应 关 
系 。 与 内 容 类 型 相关 模式 有 若干 种 ， 其 中 的 一 种 模式 与 电视 和 广播 有 关 : 观看 电视 内 
容 的 用 户 高 峰 一 般 在 晚间 来 临 ， 而 广播 内 容 的 用 户 高 峰 一 般 出 现在 早上 和 午后 。 访 问 
模式 上 的 差异 也 表明 ， 在 以 周 为 单位 的 尺度 上 ,广播 内 容 的 访问 量 在 工作 日 是 最 高 
的 ， 而 对 于 电视 内 容 ， 观 众 的 分 布 在 周末 和 工作 日 是 不 同 的 ， 在 周末 时 出 现在 午后 的 
用 户 请 求 要 比 在 工作 日 时 多 得 多 。 图 13. 6 给 出 了 一 周 内 同时 在 线 的 用 户 数量 〈 对 应 
于 两 种 媒体 内 容 类 型 的 最 大 值 ) ， 还 给 出 了 所 有 媒体 内 容 的 累计 数量 。 访 问 模式 也 随 
较 长 的 时 间 尺 度 变化 ， 因 此 资源 请 求 也 呈现 出 随时 间 尺 度 变化 的 特性 。 

图 13.6 也 显示 出 广播 和 电视 节目 中 用 户 请 求 频率 的 不 同 特性 。 广 播 内 容 和 基于 
节目 的 电视 内 容 相 比 ， 对 其 访问 更 具有 连续 性 。 当 把 用 户 请 求 分 布 同 随时 间 变 化 的 端 
用 户 接 收 数据 量 分 布 相 比 时 ， 各 类 内 容 访问 模式 的 不 同 是 显而易见 的 。 图 13.7 显示 
了 传输 数据 的 累积 量 与 一 天 中 各 时 段 最 大 值 的 相对 关系 。 我 们 发 现 ， 累 积 数据 量 在 早 
晨 的 增长 曲线 要 比 一 天 中 平常 时 间 的 数据 量 增长 的 更 为 平滑 ， 这 是 因为 每 天 清晨 大 多 
数 用 户 都 会 收听 广播 。 另 外 ， 在 晚上 大 多 数 用 户 会 选择 收看 电视 ， 此 时 需要 传输 更 多 
的 数据 。 斜 率 的 变化 在 周末 出 现 得 更 早 ， 因 为 用 户 在 周末 要 比 平日 更 早 收 看 电视 


节目 。 
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图 13.7 数据 在 不 同时 间 的 累积 传输 量 


13.7.4 ”内容 分 配 性 能 


CDN 性 能 通过 两 组 量 进行 评估 ， 第 一 组 测量 与 资源 使 用 率 相关 的 系统 开销 ， 并 
包括 分 配 带宽 、 分 发 带宽 和 存储 使 用 率 ; 第 二 组 测量 用 户 感受 到 的 服务 质量 。 

我 们 利用 CDN 的 分 层 机 制 ， 通 过 在 不 同 层 的 节点 数据 之 间 的 比较 (具体 指 从 上 
一 层 传输 到 当前 层 的 数据 量 和 从 当前 层 传 输 到 下 一 层 的 数据 量 之 间 的 比较 ) ， 来 对 
CDN 不 同 层 之 间 的 效能 进行 评估 。 因 为 数据 流 不 仅仅 发 生 在 CDN 的 相 邻 层 ， 也 可 以 
在 高 层 中 平行 进行 ， 因 此 首先 对 副本 服务 器 之 间 的 协作 优势 进行 评估 ， 这 可 以 通过 计 
算 源 服 务 器 的 实际 负载 与 无 副本 协作 情况 下 的 源 服务 器 负载 得 到 。 图 13. 8 给 出 了 每 
天 从 源 服 务 器 获得 的 数据 量 和 从 源 服 务 器 传输 到 副本 服务 器 的 数据 量 之 比 ， 以 及 每 天 
从 源 服务 器 获得 的 数据 量 和 从 另外 一 台 副 本 服务 器 传输 到 该 副本 服务 器 的 数据 量 之 比 
《 即 在 没有 副本 服务 器 协作 的 情况 下 从 源 服务 器 获得 的 数据 量 ) 。 对 几 个 月 的 数据 做 
平均 计算 之 后 得 到 的 数值 大 约 是 0. 55 ， 这 表明 通过 源 服务 器 传输 的 数据 量 和 副本 服 
务 器 之 间 交互 的 数据 量 是 差不多 的 。 该 比率 偶尔 能 够 接近 1， 说 明 大 部 分 内 容 是 通过 
源 服 务 器 获得 。 一 般 而 言 ， 以 下 情况 较为 常见 : 当 少 数 访问 量 低 的 数据 对 象 通过 一 台 
副本 服务 器 从 源 服务 器 处 获得 时 ， 因 为 访问 量 低 ， 它 们 随即 不 再 被 传输 给 其 他 副本 服 
务 器 。 基 于 这 个 事实 我 们 估计 ， 在 没有 副本 服务 器 协作 的 情况 下 ， 源 服务 器 的 负载 有 
可 能 翻 倍 。 这 个 数字 验证 了 副本 服务 器 之 间 的 协作 。 并 且 ， 我 们 推测 副本 服务 器 数量 
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的 增长 不 应 该 对 源 服务 器 的 负载 有 明显 影响 ， 因 为 所 有 副本 服务 器 都 是 通过 全 网 状 网 
的 形式 相连 ， 并 且 每 一 个 区 域内 的 负载 都 保持 在 合理 水 平 线 上 。 此 处 的 合理 水 平 线 是 
指 在 每 一 个 ISP 网 络 内 的 代理 服务 器 /缓存 都 能 够 在 几 个 小 时 内 缓存 ISP 用 户 所 请 求 
的 所 有 内 容 ， 也 就 是 说 ， 在 此 段 时 间 内 缓存 内 容 相 对 稳定 。 在 一 个 拥有 了 个 副本 服务 
露 的 系统 中 ， 有 副本 协作 的 源 服 务 器 负载 与 没有 副本 协作 的 负载 之 比 应 该 在 1: (n- 
1) 左右 ， 这 个 比率 是 以 副本 服务 器 间 增 加 的 带宽 使 用 成 本 换 来 的 。 





图 13.8 副本 服务 器 协作 对 于 源 服务 器 负载 的 影响 


接 下 来 我们 检查 每 天 的 数据 吞吐 量 〈 抵 达 副 本 服务 器 和 来 自 副本 服务 器 ) ， 数 
据 吞 吐 量 通 过 在 给 定 的 副本 服务 器 上 ， 对 所 有 缓存 求 和 得 出 。 图 13.9 给 出 了 每 天 每 
台 副 本 服务 器 获得 的 数据 吞吐 量 与 给 定 的 某 台 副本 服务 器 对 它 所 在 区 域内 的 所 有 代理 
服务 器 /缓存 所 传输 的 数据 吞吐 量 总 和 之 间 的 比率 。 以 几 个 月 的 周期 做 平均 之 后 得 到 
的 数值 大 约 是 0.13 (对 于 Poznan 副本 服务 器 ) 和 0.12 (对 于 Krakow 副本 服务 器 ) 。 
两 个 数值 处 于 同一 数量 级 ， 差 别 可 以 用 加 载 在 Poznan 副本 服务 器 上 的 较 高 负载 来 解 
释 。 因 为 有 了 CDN 分 层 机 制 中 高 层 的 存在 ， 这 个 进出 数据 量 比率 使 得 我 们 能 够 预测 
源 服务 器 的 负载 降低 情况 。 如 果 代理 服务 器 /缓存 需要 直接 从 源 服务 器 处 获得 内 容 ， 
那么 该 服务 器 的 负载 会 高 出 8 倍 左右 。 因 此 ， 我 们 得 出 结论 ，CDN 的 高 层 节点 对 于 
减轻 源 服务 器 负载 非常 有 效 。 副 本 服务 器 的 负载 取决 于 它 所 在 区 域内 代理 服务 器 /组 
存 的 数量 ， 二 者 是 线性 关系 。 因 此 ， 给 定 区 域内 用 户 数量 的 增长 ， 会 导致 代理 服务 器 
/缓存 的 数量 增长 ， 同 时 也 会 导致 另外 一 台 副 本 服务 器 的 加 入 ， 并 拆 分 已 有 区 域 。 





图 13.9 副本 服务 器 收发 数据 量 的 对 比 
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针对 CDN 分 层 架 构 中 处 于 低层 的 代理 服务 器 /缓存 ， 我 们 对 节点 的 进出 数据 量 进 
行 了 一 个 类 似 的 比较 。 不 过 ， 在 这 种 情况 下 还 需要 考虑 到 一 个 事实 ， 即 用 户 经 常 不 会 
看 完全 部 的 内 容 ， 因 此 往往 只 有 部 分 内 容 会 传递 给 用 户 ， 同 时 整个 内 容 被 存储 在 代理 
服务 器 /缓存 处 。 因 此 ， 除 了 被 代理 服务 器 /缓存 传输 给 用 户 的 数据 量 之 外 ， 同 时 还 通 
过 对 所 有 用 户 访问 的 对 象 无论 哪 一 部 分 真正 被 用 户 看 过 ) 的 大 小 求 和 ,计算 其 理 
论 上 限 。 代 理 服务 器 /缓存 获得 的 数据 量 和 用 户 每 天 获得 的 数据 量 之 比 大 约 是 0. 04。 
这 说 明 ， 代 理 服务 器 /缓存 传输 的 数据 比 它们 获得 的 数据 高 出 25 倍 左右 。 代 理 服务 器 
/缓存 获得 的 数据 量 和 数据 传输 的 理论 上 限 之 比 大 约 不 到 10 倍 。 代 理 服 务 器 /缓存 负 
载 与 用 户 数 量 呈 线性 关系 ， 因 为 内 容 通 过 单 播 的 方式 传 给 用 户 。 参 照 从 源 服务 器 到 
CDN 的 数据 传输 ， 也 考察 了 代理 服务 器 /缓存 传输 的 数据 量 ， 为 了 估计 源 服 务 器 的 负 
载 ， 我 们 将 考虑 设 有 CDN 时 的 情况 〈( 即 不 存在 缓存 代理 的 情况 ) CDN。 结 果 表 明 ， 
当 一 个 代理 服务 器 /缓存 的 用 户 全 部 定向 到 源 服务 器 时 ， 源 服务 器 传输 的 数据 量 大 约 
是 它 传 给 副本 服务 器 数据 量 的 50 倍 。 

为 了 评估 内 容 缓 存 的 效用 ， 也 计算 了 在 不 同时 间 尺 度 下 位 于 CDN 不 同 层 的 每 个 
内 容 被 访问 的 平均 次 数 ， 该 值 较 高 原因 有 可 能 是 因为 资源 不 足 ， 如 较 少 的 存储 空间 、 
可 用 性 ,或 因为 低 效 的 存储 空间 管理 ， 如 内 容 蔡 换 策略 等 。 在 几 个 月 内 对 源 服务 器 的 
访问 次 数 做 平均 ， 可 知 每 个 内 容 的 访问 次 数 大 约 是 1.02， 这 表明 绝 大 多 数 对 象 仅仅 
在 源 服务 器 上 被 获取 过 一 次 。 在 每 一 个 副本 服务 器 上 ， 内 容 访问 的 平均 次 数 和 这 个 数 
量 相差 无 几 。 对 于 代理 服务 器 /缓存 而 言 ， 该 数值 会 高 一 些 ， 在 几 个 月 的 时 间 尺 度 上 
做 平均 的 结果 在 1.2 左右 。 当 降低 时 间 尺 度 再 做 平均 时 ， 该 数值 迅速 趋 于 1， 说 明 就 
算 一 个 内 容 从 副本 服务 器 上 被 获取 的 次 数 超过 一 次 ， 彼 此 之 间 也 会 相隔 数 天 或 者 数 
周 。 上 述 分 析 表 明 ，CDN 具备 了 高 效 的 存储 空间 供 负载 使 用 ， 并 且 系 统管 理 良好 。 

源 服务 器 负载 和 网 络 带 宽 使 用 率 的 下 降 所 付出 的 代价 是 对 存储 空间 的 更 高 要 求 。 
我 们 将 一 段 时 间 内 某 节 点 存储 的 数据 量 与 该 节点 传输 的 数据 量 进行 了 比较 ， 借 此 对 
CDN 运行 中 与 存储 相关 的 开销 进行 了 评估 。 存 储 空间 使 用 率 通过 一 段 时 间 内 一 个 节 
点 存储 的 所 有 对 象 的 大 小 之 和 计算 。 对 于 副本 服务 器 而 言 ， 存 储 和 传输 之 比 与 获取 和 
传输 之 比 非常 接近 ， 因 为 每 一 个 内 容 的 访问 数 略 高 于 1。 因 此 ， 估 计 日 常情 况 下 每 一 
个 副本 服务 器 传输 的 数据 要 8 倍 于 它 存储 的 数据 。 每 天 代理 服务 器 /缓存 的 存储 数据 
量 与 传递 给 用 户 的 数据 量 之 比 大 约 是 0.4， 如 果 用 户 在 每 次 访问 某 内 容 时 都 要 播放 全 
部 内 容 ， 代 理 服务 器 /缓存 传递 给 用 户 的 数据 量 大 约 要 高 出 8 倍 ， 这 就 会 使 存储 与 传 
输 的 比值 相对 较 低 。 以 上 数据 表明 ， 采 用 两 层 体 系 架构 组 织 起 来 的 大 量 CDN 节点 可 
以 增加 存储 空间 的 可 用 数量 。 


13.7.5 用 户 感受 到 的 服务 质量 


用 户 感受 到 的 服务 质量 表现 为 命中 率 ， 即 能 被 至 少 一 个 CDN 节点 服务 的 用 户 请 
求 数 。 在 内 容 分 配方 面 ， 命 中 率 与 CDN 性 能 直接 相关 。 内 容 播放 的 质量 对 于 用 户 感 
知 质 量 的 影响 非常 明显 ; 然而 ， 它 主要 取决 于 从 代理 服务 器 /缓冲 到 用 户 之 间 的 网 络 
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连接 状况 。 播 放 质量 难以 通过 客观 方式 进行 量化 ， 因 此 我 们 使 用 内 容 访问 时 间 对 
CDN 的 效能 进行 评估 。 访 问 时 间 取 决 于 用 户 请 求 是 否 得 到 响应 。 如 果 得 到 响应 ， 那 
么 响应 时 间 更 多 地 取决 于 管理 节点 与 用 户 之 间 的 网 络 连接 ， 而 非 CDN 的 整体 效能 和 
区 域 管理 器 的 负载 。 如 果 没有 得 到 响应 ， 那 么 直通 式 的 内 容 分 配 和 快速 启动 模式 会 使 
分 配 时 间 和 分 配 路 径 与 内 容 对 象 大 小 无 关 。 因 此 ， 可 以 将 用 户 请 求 分 成 “命中 ”或 
者 “缺失 ”来 评估 内 容 访问 时 间 。 命 中 率 在 用 户 层 上 定义 ， 并 且 往 往 高 于 从 代理 服 
务 右 /缓存 处 获得 的 命中 率 ， 原 因 是 用 户 可 以 从 默认 的 代理 服务 器 /缓存 处 直接 访问 内 
容 ， 而 传输 给 指定 代理 服务 器 /缓存 的 内 容 分 配 是 在 响应 请 求 时 才 启 动 的 。 一 般 而 言 ， 
从 CDN 中 观察 到 的 命中 率 在 0.9 以 上 ， 因 此 我 们 有 理由 认为 绝 大 多 数 的 用 户 感知 到 
的 访问 延 时 微乎其微 。 


13.8 未 来 研究 方向 


FKE, BA iTVP CDN 是 一 个 在 大 地 域 尺 度 上 已 经 完全 处 于 自主 运营 中 的 成 熟 
网 络 ， 未 来 研究 中 仍然 有 若干 值得 关注 的 方向 ， 这 其 中 有 些 与 内 容 分 发 直接 相关 ， 有 
些 则 关注 于 提供 给 用 户 的 服务 集 以 及 这 些 服 务 集会 给 ITVP CDN 带 来 什么 样 的 影响 。 

其 中 的 一 个 挑战 将 会 是 监控 系统 的 扩展 情况 ， 并 按 需 对 CDN 进行 扩容 。 进 行 决 
策 时 ， 可 以 根据 资源 使 用 情况 和 用 户 感受 到 的 质量 来 添加 新 的 副本 服务 器 和 选择 放置 
地 点 ， 并 对 已 有 区 域 进 行 划分 。 也 就 是 说 ， 难 点 在 于 监控 整个 系统 ， 并 根据 系统 架构 
来 确定 系统 扩展 的 规则 ， 当 然 该 系统 架构 在 设计 时 应 确保 CDN 的 高 扩展 性 。 

目前 ，iTVP CDN 中 的 内 容 分 配 主要 通过 拉 取 模式 进行 ， 每 一 个 节点 的 缓存 内 容 
主要 由 用 户 请 求 和 对 请 求 的 响应 来 决定 。 推 送 模式 的 内 容 分 配 机 制 主要 用 于 高 访问 量 
内 容 发 布 之 后 的 实时 传输 。 我 们 将 研究 使 用 推送 模式 在 更 大 的 程度 上 作为 拉 取 模式 的 
补充 的 效果 。 前 面 的 结果 显示 了 ，CDN 的 负载 以 天 或 周 为 单位 变化 ， 因 此 资源 使 用 
情况 也 随 着 这 样 的 时 间 尺 度 发 生变 化 。 我 们 计划 将 那些 未 使 用 的 资源 用 于 内 容 分 配 ， 
以 提升 用 户 感知 到 的 质量 。 特 别 地 ， 在 资源 可 用 度 很 高 的 情况 下 ， 在 用 户 访问 之 前 就 
规划 好 内 容 的 分 配 。 

iTVP CDN 本 来 是 被 设计 为 一 个 供 大 量 独立 内 容 提 供 商 使 用 的 平台 。 我 们 期 望 ， 
未 来 不 仅仅 内 容 提供 商 的 数量 会 增加 ， 端 用 户 也 能 够 扮演 内 容 消费 者 和 内 容 提供 者 的 
双重 角色 。 也 就 是 说 ， 在 大 尺度 上 用 户 组 之 间 的 内 容 交换 会 成 为 未 来 的 一 个 潜在 需 
求 ， 这 些 变化 将 能 够 决定 未 来 的 研究 方向 。 我 们 将 研究 是 否 需要 实现 一 个 混合 式 系 
统 ， 其 中 CDN 和 P2P 结合 在 一 起 ， 就 如 同 Dong 等 人 ”和 Xu 等 人 ”所 提出 的 那样 。 
这 样 的 组 合 是 可 行 的 ， 并 可 能 具备 一 定 优势 (如 在 ISP 网 络 的 内 部 ) 。 然 而 ， 直 接 将 
P2P 类 型 的 分 配 机 制 应 用 到 多 媒体 流 会 带 来 一 定 的 挑战 ， 有 很 多 问题 需要 解决 ， 如 端 
用 户 可 用 带宽 的 非 对 称 性 问题 。 

构建 iTVP 平台 的 一 个 主要 目标 就 是 给 端 用 户 提供 交互 式 的 访问 服务 。 交 互 式 服 
务 逐 渐 被 引入 ， 一 些 服务 (如 实时 流传 输 中 的 时 间 条 拖 动 或 者 个 人 视频 点 播 ) 都 能 
以 个 性 化 的 方式 向 用 户 提供 ， 并 对 CDN 的 资源 使 用 带 来 重大 影响 。 因 此 ， 我 们 计划 
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对 交互 式 访问 模式 下 的 CDN 设计 问题 进行 研究 。 除 了 这 些 新 服务 ， 我 们 也 计划 扩展 
终端 设备 的 范围 ， 使 得 用 户 能 更 加 方便 地 访问 iTVP 服务 。 具 体 而 言 ， 我 们 考虑 引入 
多 种 多 样 的 手持 设备 ， 如 掌上 电脑 或 手机 。 此 类 设备 不 仅 需要 我 们 调整 内 容 的 形式 和 
格式 ， 也 需要 考虑 内 容 分 配 的 新 局 面 ， 即 用 户 的 移动 性 。 因 此 ， 我 们 将 研究 用 户 从 一 
个 终端 设备 迁移 到 另外 一 个 终端 设备 的 移动 性 ， 例 如 用 户 有 可 能 会 从 手机 转移 到 另 一 
个 更 高 质量 的 设备 。 


13.9 写 给 使 用 者 


我 们 相信 ， 多 媒体 CDN 的 发 展会 为 网 络 感 知 服务 铺 平 道 路 ， 并 能 使 其 通过 宽带 
IP 网 络 无 颖 对 接 到 端 用 户 。 很 多 面向 消费 者 的 大 规模 应 用 对 于 网 络 性 能 要 求 很 高 ， 
需要 在 全 网 进行 分 发 ， 因 此 需要 对 网 络 架构 进行 详细 部 署 和 周密 策划 ， 以 达到 所 期 户 
的 性 能 和 质量 要 求 。 我 们 预计 ， 多 媒体 CDN 开发 的 下 一 步 工 作 将 表现 为 从 内 容 分 发 
转变 为 网 络 层 的 高 级 服务 分 发 。 这 一 变化 使 得 应 用 服务 的 透明 配置 成 为 下 一 代 CDN 
的 主要 目标 。 未 来 的 应 用 服务 将 使 用 内 容 资源 以 及 端 用 户 输入 ， 这 些 都 将 通过 动态 、 
高 度 分 布 式 和 多 功能 的 工作 流 来 进行 处 理 。 因 此 ， 应 用 服务 将 分 发 个 人 化 和 交互 性 的 
多 媒体 体验 。 这 种 方法 会 使 多 通道 的 内 容 分 发 和 不 同 多 媒体 环境 中 的 系统 集成 变 为 可 
能 ， 并 使 下 一 代 多 媒体 应 用 能 够 根据 端 用 户 的 性 能 来 规划 内 容 。 这 样 的 开发 场景 将 会 
在 很 多 研究 领域 带 来 挑战 ， 如 资源 管理 和 内 容 分 配 、 工 作 流 程 的 建立 和 规划 、 任 务 和 
相关 性 管理 、 服 务 挖掘 、 服 务 监控 以 及 网 络 层 集成 等 。 我 们 期 望 在 不 远 的 未 来 ， 这 样 
的 环境 不 仅 能 够 由 市 场 趋势 来 驱动 (如 高 清 视频 、 网 络 交互 游戏 或 者 虚拟 工作 环境 
等 ) ， 而 且 也 通过 端 用 户 对 任何 时 间 和 地 点 访问 服务 的 期 望 来 驱动 。 


13.10 总 结 


本 章 提出 了 iTVP 平台， 该 平台 的 目标 是 通过 宽带 IP 网 络 向 用 户 提供 大 规模 的 视 
频 内 容 直 播 和 点 播 的 分 发 服务 。iTVP 平台 的 核心 组 件 是 一 个 CDN 网 络 ， 设计 一 个 IP 
网 络 上 分 发 多 媒体 内 容 的 CDN 需要 考虑 到 多 媒体 内 容 本 身 的 特性 和 内 容 传 递 模式 ， 
即 内 容 流 的 特性 。 我 们 描述 了 影响 设计 的 若干 要 素 ， 并 提供 了 相对 应 的 CDN 架构 以 
及 CDN 节点 的 放置 规则 、 内 容 分 配 、 用 户 请 求 路 由 机 制 等 。 因 为 iTVP 的 CDN 是 一 
个 真实 的 系统 ， 部 署 并 运行 在 真实 环境 中 ， 因 而 使 得 我 们 能 有 机 会 验证 所 提出 的 设计 
方案 。 我 们 分 析 了 两 层 分 级 架构 的 优势 和 成 本 。 在 实验 中 发 现 ，iTVP CDN 能 有 效 降 
低 源 服 务 器 的 负载 ， 并 高 效 地 利用 网 络 带宽 和 存储 空间 ， 同 时 也 能 够 确保 端 用 户 快 速 
访问 所 需 内 容 。 我 们 也 探讨 了 CDN 的 可 扩展 性 ， 因 为 iTVP 本 身 就 是 一 个 高 度 动态 的 
系统 。 随 着 内 容 提供 商 资料 库 的 持续 增长 和 节目 日 益 具 有 吸引 力 ，iTVP 平台 的 新 用 
户 随 之 不 断 增加 。 因 此 ， 我 们 对 资源 使 用 率 和 用 户 感 知 到 的 服务 质量 进行 了 持续 监 
控 。 利 用 系统 收集 到 的 数据 ， 可 以 对 内 容 访问 模式 进行 详细 的 分 析 ， 从 而 能 够 对 
CDN 的 功能 设计 进行 指导 ， 并 使 资源 得 到 更 加 有 效 的 利用 。 最 后 ， 我 们 讨论 了 这 个 
方面 未 来 的 若干 研究 方向 。 
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随 着 近 些 年 来 无 线 访问 技术 以 及 移动 终端 技术 的 发 展 ， 移 动 网 络 正在 成 为 互联 网 
的 一 个 重要 的 组 成 部 分 "'” 。 目 前 被 广泛 部 署 的 移动 网 络 使 得 新 的 应 用 具备 了 移动 
性 ， 同 时 使 有 线 Web 应 用 拓展 到 移动 终端 。 移 动 无 线 网 络 提供 了 一 个 丰富 、 动 态 、 
交互 性 的 服务 ， 如 GPS 导航 信息 、 移 动 电 视 、 车 辆 交通 信息 和 面向 定位 服务 。 上 述 
这 类 服务 的 正常 运行 是 建立 在 快速 、 高 效 的 数据 传播 技术 基础 之 上 的 ， 该 技术 可 以 减 
少 网 络 流量 和 移动 用 户 的 平均 等 待 时 间 。 

在 有 线 网 络 中 ， 网 络 性 能 通常 可 以 通过 增加 额外 带宽 这 种 低 成 本 的 方法 来 得 以 提 
升 。 但 是 这 种 方法 对 于 移动 网 络 设施 却 不 适用 ， 因 为 这 些 移动 网 络 都 工作 在 固定 的 频 
段 ， 而且 由 于 电磁 干扰 的 原因 ， 数 据 传输 速率 存在 着 内 在 的 局 限 性 。 当 移动 用 户 
开始 使 用 对 带宽 敏感 的 应 用 服务 时 (如 流 媒体 等 ) ， 这 个 问题 会 变 得 更 加 严重 。 在 这 
种 情况 下 ， 缓存 和 预 取 是 可 行 的 解决 方案 。 值 得 一 提 的 是 ， 这 些 方法 已 经 在 有 线 网 络 
中 被 大 量 使 用 ， 通 过 将 流量 从 过 载 的 内 容 提 供 商 处 迁移 到 内 容 消 费 者 较 近 的 地 方 ， 从 
而 实现 带宽 资源 的 优化 “  。 尽 管 这 些 方 法 具备 若干 优点 (如 保留 网 络 资源 与 减少 延 
迟 等 ) ,但 动态 内 容 和 资源 饥 渴 型 应 用 (如 多 媒体 应 用 ) 的 发 布 仍 是 一 个 具有 挑战 性 
的 问题 。 

内 容 分 发 网 络 (CDN) 通过 将 用 户 所 需 内 容 移 至 所 谓 的 互联 网 边缘 ,使 其 与 用 
户 更 加 贴近 来 解决 上 述 问题 呈 ] 。 关 于 CDN 的 介绍 可 以 参看 本 书 第 一 部 分 的 相关 内 
容 。 迄 今 为 止 ， 对 于 有 线 网 络 的 CDN 技术 已 有 了 大 量 的 研究 ”…”” ， 但 是 对 于 移动 
网 络 的 研究 还 很 少 ''” ， 这 是 由 于 前 些 年 大 多 数 移动 终端 访问 互联 网 的 能 力 有 限 。 但 
是 随 着 新 的 蜂窝 网 络 技术 (如 3G) 和 无 线 技术 (Wi-Fi) 的 出 现 ， 形势 已 经 发 生 
了 变化 ， 移 动 终端 访问 互联 网 的 服务 和 其 他 数据 服务 的 速度 已 经 能 够 与 传统 的 有 线 访 
[n] x BEAR SEU 。 先 前 的 一 些 研究 “… ”表明 ， 协 作 式 缓存 技术 在 移动 网 络 环境 中 可 
以 改善 网 络 的 性 能 和 信息 发 布 效 率 。 所 以 我 们 相信 ，CDN 设施 可 以 提供 一 个 可 扩展 
且 划 算 的 机 制 ， 来 加 速 在 移动 无 线 网 环境 下 的 信息 发 布 $I 。 但 是 ， 移 动 无 线 网 络 设 
施 代表 的 是 一 个 与 传统 的 有 线 网 络 完 全 不 同 的 信息 媒介 ， 具体 表现 在 使 用 的 访问 设 
备 、 内 容 可 用 性 、 带 宽 以 及 用 户 成 本 等 方面 。 所 以 ， 典 型 的 CDN 不 能 使 移动 无 线 网 
络 得 到 增强 ， 因 为 传统 的 CDN 并 没有 将 移动 无 线 网 的 特点 考虑 进去 。 于 是 ， 我 们 在 
此 定义 了 移动 CDN: 在 移动 无 线 网 络 设施 中 发 布 内 容 的 代理 缓存 服务 器 覆盖 网 。 特 
别 地 ，CDN 可 以 为 开发 新 兴 的 移动 计算 技术 提供 一 个 新 的 平台 。 
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本 章 的 主要 内 容 是 介绍 移动 CDN 所 面临 的 挑战 和 现状 ， 讨 论 移动 无 线 网 络 设施 
的 发 展 ， 以 及 研究 信息 发 布 在 移动 CDN 中 将 如 何 改善 的 问题 。 

本 章 的 其 他 部 分 内 容 将 安排 如 下 : 14. 2 节 介 绍 移动 CDN 的 必要 性 ，14. 3 节 描 述 
移动 CDN，14. 4 节 介 绍 移动 CDN 中 的 无 线 网 络 设施 ，14. 5 节 讨 论 有 哪些 现 有 的 媒介 
可 以 在 移动 CDN 中 采用 ，14. 6 节 提 供 一 些 移动 CDN 的 具体 实现 及 相关 实验 情况 ， 
14.7 节 讨 论 未 来 的 研究 方向 ，14. 8 节 进 行 总 结 。 


14.2 动机 


移动 互联 网 ， 其 定义 为 通过 移动 设备 无 线 访问 Intemet 上 的 数字 内 容 ， 由 于 大 量 
用 户 的 使 用 而 迅速 发 展 。 最 近 的 研究 表明 ， 日 本 的 移动 互联 网 用 户 数 已 经 超过 有 线 互 
联网 用 户 数 "] 。 可 以 说 ， 移 动用 户 在 哪里 ， 移 动 互 联网 就 在 哪里 ; 或 者 说 用 户 不 论 在 
何 时 何 地 都 期 望 使 用 移动 设备 上 网 ， 获 取 所 需 信息 。 

如 今 ， 进 军 移动 互联 网 的 内 容 提供 商 在 不 断 地 增加 。 例 如 ， 在 汽车 工业 里 已 经 将 
此 类 移动 技术 引入 到 汽车 设备 中 ， 用 来 给 司机 提供 准确 的 导航 和 交通 辅助 (交通 状 
况 如 交通 事故 情况 、 拥 堵 情 况 、 路 况 信 息 及 临时 绕 行 信息 等 ) 。 同 时 ， 这 些 设备 也 可 
以 通过 多 媒体 数据 来 提醒 司机 注意 应 对 紧急 情况 (AR, wR, NR Edi. E 
管 在 大 多 数 情况 下 一 个 简单 的 文字 信息 已 经 足够 ， 但 是 多 媒体 形式 的 信息 如 事故 的 图 
片 、 录 像 (或 者 前 方 危险 状况 的 视频 ) 使 得 司机 可 以 更 准确 、 更 直观 地 获取 信息 ， 
从 而 采取 必要 的 措施 。 另 外 ， 银 行业 已 经 意识 到 移动 互联 网 为 发 展 自助 银行 业务 所 带 
来 的 商机 。 如 今 ， 许 多 移动 手机 用 户 已 经 可 以 通过 他 们 的 手持 设备 来 享受 这 种 服务 。 
另外 ， 移 动 互 联网 也 给 娱乐 业 带 了 新 的 思路 ， 如 在 线 音乐 、 在 线 图 书 、 在 线 电影 以 及 
在 线 游 戏 。 例 如 ， 旅 行者 或 者 上 班 族 可 以 在 等 车 的 时 候 用 他 们 的 移动 设备 (如 PSP) 
玩 游 戏 ， 也 可 以 与 另外 一 个 地 方 的 朋友 聊天 。 

上 述 例子 的 实现 不 但 需要 先进 的 无 线 网 络 技术 和 支持 设备 ， 同 时 也 需要 支持 高 效 
的 信息 发 布 技术 、 可 升级 和 可 拓展 的 互联 网 设施 。 从 技术 的 角度 来 说 ， 目 前 先进 的 无 
线 网 络 技术 (如 3G、GPRS、DSRC2 ) 已 经 可 以 确保 移动 设备 访问 互联 网 和 其 他 数据 
服务 的 速度 与 传统 的 有 线 网 络 平分 秋色 。 

CDN 设施 “提供 了 一 个 可 升级 且 节 省 成 本 的 机 制 ， 来 加 速 在 有 线 网 络 环境 下 的 
信息 发 布 。 但 是 ， 由 于 未 将 移动 性 考虑 在 内 ， 常 用 的 CDN 设施 并 不 适合 来 增强 移动 
互联 网 的 性 能 。 移 动用 户 需求 的 变化 不 仅 随 着 请 求 内 容 流 行 度 的 变化 而 变化 ， 也 与 用 
户 的 移动 性 有 关 。 每 个 用 户 的 需求 都 与 相应 的 内 容 、 时 间 和 地 点 有 关 。 为 了 满足 移动 
用 户 ， 服 务 器 覆盖 网 必须 位 于 无 线 网 络 提供 商 的 基站 附近 。 

因此 ， 还 需要 重新 考虑 CDN 架构 来 满足 移动 用 户 的 需求 。 移 动 网 络 的 一 个 特性 
就 是 资源 缺乏 ; 对 于 移动 设备 的 小 巧 尺寸 而 言 ， 存 储 能 力 、 计 算 能 力 和 电源 续航 能 力 
上 都 存在 着 诸多 限制 。 例 如 ， 当 父亲 用 Wi - Fi 摄影 机 给 他 正在 海滩 玩 夏 的 三 岁 孩 子 


Ə 即 专用 短程 通信 技术 ， 见 http; //www. leearmstrong. com/DSRC/DSRCHomeset. htm, 
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拍 录像 时 ， 他 会 希望 将 视频 上 传 至 服务 器 ， 以 便 可 以 腾 出 空间 来 拍摄 更 多 的 照片 或 录 
像 。 不 幸 的 是 ， 到 目前 为 止 ， 传 统 的 CDN 还 不 支持 将 用 户 内 容 上 传 至 代理 缓存 服务 
器 (surrogate server) KERE, CDN 的 发 布 模块 负责 决定 哪些 内 容 可 以 由 代理 缓存 
服务 器 复制 保存 。 鉴 于 此 ， 移 动 CDN 中 的 代理 缓存 服务 器 应 该 提供 面向 用 户 的 服务 ， 
这 可 以 通过 给 移动 用 户 分 配 一 定 比例 的 缓存 空间 来 让 用 户 直接 将 内 容 上 传 。 

CDN 需要 考虑 的 另外 一 个 参数 是 移动 用 户 的 导航 行为 ， 影 响 这 个 参数 的 最 显著 
因素 是 用 户 实际 使 用 的 移动 设备 。 然 而 ， 移 动 设备 输入 能 力 有 限 ， 例 如 手机 键盘 相对 
于 计算 机 键盘 而 言 ， 允 许 输入 的 文本 很 少 。 移 动用 户 也 必须 接受 较 慢 同 时 却 费用 昂贵 
的 下 载 服务 。 所 以 ， 这 些 特点 导致 了 用 户 采用 移动 互联 网 和 有 线 网 络 去 获取 信息 所 带 
来 的 差别 。 

用 户 的 移动 性 促进 了 移动 CDN 中 面向 服务 的 手机 定位 技术 的 发 展 。 假 设 一 个 移 
动用 户 使 用 了 支持 CDN 的 应 用 ， 当 他 在 移动 时 应 该 确保 这 个 应 用 能 够 被 其 他 的 代理 
缓存 服务 器 复制 ， 以 便 该 应 用 能 够 始终 “伴随 ”用 户 。 手 机 定位 技术 甚至 还 可 以 用 
来 检测 用 户 的 互联 网 连接 速度 ， 这 一 点 对 于 网 站 的 拥有 者 非常 重要 ， 因 为 他 们 希望 可 
以 向 其 客户 证 明 多 媒体 应 用 (如 广告 ) 是 可 行 的 。 

此 外 ， 典 型 的 CDN 不 提供 任何 涉及 用 户 〈 即 与 CDN 交互 的 用 户 ) 实时 状态 和 底 
层 网 络 设施 的 监控 机 制 。 然 而 ， 考 虑 到 移动 无 线 网 络 设施 自身 存在 着 若干 局 限 性 ， 这 
些 监控 机 制 是 移动 CDN 中 支持 内 容 发 布 的 关键 组 成 部 分 ， 这 些 局 限 性 简要 介绍 如 下 。 

(1) 网 络 频繁 断 线 

用 户 的 随机 性 或 组 织 移动 性 会 严重 影响 网 络 的 连通 性 ， 主 要 表现 在 : 与 基站 或 
者 其 他 邻近 移动 设备 的 连接 时 间 短 ; @ 高 楼 、 树 木 、 车 辆 等 障碍 物 都 会 显著 影响 无 线 
信号 的 质量 ;@ 用 户 临 时 处 于 无 线 网 覆盖 范围 外 的 几率 。 以 上 因素 都 会 造成 带宽 下 降 
或 彻底 失去 连接 ， 最 终 导致 信息 丢失 。 

(2) 网 络 分 上 | 

上 述 频繁 断 网 的 情况 会 导致 移动 无 线 网 络 分 片 ， 使 移动 站 点 之 间 的 端 对 端 连 接 失 
效 ， 从 而 降低 了 信息 的 有 效 性 。 

(3) 移动 节点 约束 

大 多 数 的 移动 设备 会 面 对 很 多 约束 ， 如 处 理 能 力 、 存 储 容量 和 最 重要 的 续航 时 间 
等 。 这 些 限制 是 源 于 设备 通常 是 用 电池 供电 ， 而 且 其 小 尺寸 也 就 意味 着 处 理 能 力 和 存 
储 容量 不 会 太 好 。 

鉴于 移动 无 线 网 络 的 以 上 限制 ，CDN 很 有 必要 了 解 移动 用 户 的 状态 ， 这 样 可 以 
减少 整个 网 络 的 流量 。 例 如 ， 一 个 移动 用 户 要 将 一 个 播客 (podcast) 下 载 到 MP3 di 
放 器 ， 但 是 在 下 载 的 过 程 中 ， 一 旦 电池 的 电量 耗 尽 则 会 导致 设备 掉 线 。 在 这 种 情况 
下 ，CDN 应 该 能 获知 用 户 当前 的 状态 ， 并 停止 传输 数据 。 

以 上 这 些 论述 可 以 总 结 为 :以 低 成 本 的 形式 有 效 地 为 移动 用 户 发 布 信息 非常 具有 
挑战 性 ， 尤 其 在 应 用 服务 (如 流 媒体 、 动 态 内 容 ) 日 益 增 长 及 移动 无 线 环 境 本 身 存 
在 局 限 的 情况 下 。 移 动 CDN 的 设施 将 面 对 这 些 挑战 ， 下 一 节 将 深入 介绍 移动 CDN。 
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14.3 移动 CDN 


与 有 线 CDN 不 同 ， 移 动 CDN 通过 配置 一 系列 的 无 线 网 络 (如 蜂窝 网 、Wi - Fi 
等 ) 来 向 移动 设备 提供 诸如 动态 数据 和 丰富 的 多 媒体 内 容 传输 等 高 质量 的 服务 。 特 
别 地 ， 移 动 CDN 的 网 络 设施 可 以 分 解 为 有 线 网 络 设 施 和 无 线 网 络 设施 。 前 者 在 有 线 
CDN 环境 下 负责 提供 源 服务 器 与 代理 缓存 服务 器 之 间 的 连接 以 及 代理 缓存 服务 器 与 
网 络 组 件 之 间 的 连接 ， 如 交换 机 、 路 由 器 、3GVZCSM 基站 (BS), Wi -Fi 无 线 接 人 点 
(AP) 。 无 线 网 络 设施 负责 无 线 CDN 环境 下 静态 用 户 和 移动 用 户 的 通信 和 内 容 发 布 。 
所 以 ,客户 端 一 服务 器 之 间 的 通信 被 三 个 通信 流 所 替代 : 中 用 户 与 无 线 网 络 边缘 
(BS 或 AP) ，@ 无 线 网 络 边缘 (BS 或 AP) 与 代理 缓存 服务 器 ，@@ 代 理 缓存 服务 器 与 
源 服务 器 。 一 个 典型 的 移动 CDN 如 图 14. 1 所 示 。 





图 14.1 一 个 典型 的 移动 CDN 


考虑 到 代理 缓存 服务 器 应 该 被 安装 在 无 线 网 络 的 3G/GSM 基站 (BS) X Wi - Fi 
接 入 点 (AP)“ 附 近 ”， 所 以 移动 CDN 的 拓扑 结构 应 该 重新 配置 ， 并 重新 设计 代理 组 
存 服 务 器 的 放置 地 点 ， 以 充分 覆盖 移动 无 线 设施 。 由 于 基站 数量 巨大 ， 移 动 CDN 应 
该 比 典型 的 传统 CDN 集成 更 多 的 代理 缓存 服务 器 。 

鉴于 代理 缓存 服务 器 的 架构 ， 它 们 的 缓存 应 该 被 分 成 两 个 部 分 来 支持 面向 用 户 的 
服务 。 一 部 分 用 来 复制 (与 CDN 运营 商 有 合约 的 ) 源 服务 器 的 待 发 布 内 容 ， 另 外 一 
部 分 用 来 存储 用 户 的 上 传 内 容 。 进 一 步 而 言 ， 一 个 移动 CDN 的 代理 缓存 服务 器 也 应 
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该 向 移动 用 户 提 供 地 理 位 置 的 定位 服务 。 这 样 的 服务 需要 定义 一 个 服务 探索 协议 ,来 
通过 移动 用 户 的 位 置 (移动 用 户 此 刻 的 地 理 区 域 或 具体 位 置 ) 选择 代理 缓存 服务 器 ， 
这 样 便于 将 应 用 转 到 距离 移动 用 户 最 近 的 代理 缓存 服务 器 。 

除了 有 关 移 动 CDN 的 架构 搭建 问题 ， 被 复制 内 容 的 发 布 策略 也 十 分 重要 。 大 多 
数 CDN 提供 商 使 用 非 协 作 式 或 协作 式 的 拉 取 方法 ” 。 这 两 种 方法 的 主要 特点 是 它们 
都 是 反应 式 的 ; 一 个 数据 对 象 只 有 在 用 户 请 求 的 情况 下 才 会 被 缓存 ， 所 以 当 用 户 数量 
很 多 时 这 些 方法 将 导致 通信 成 本 (信息 交互 量 ) 的 陡然 增加 。 另 外 ， 当 内 容 变化 非 
常 快 或 同步 需求 十 分 严格 时 ， 这 些 方 法 将 不 能 保证 可 靠 性 。 鉴 于 上 述 局 限 ， 这 种 拉 取 
式 方 法 在 移动 无 线 环境 下 是 不 可 行 的 ， 而 是 应 该 着 重 研究 基于 协作 的 内 容 推 送 方法 。 
与 拉 取 方法 〈 非 协作 式 方法 和 协作 式 方 法 ) 需要 等 待 用 户 请 求 信息 不 同 ， 协 作 式 推 
送 方 法 让 源 服务 器 预先 将 信息 推送 至 缓存 服务 器 以 减少 访问 耗 时 。Chen 等 人 "的 相 
关 人 研究 显示 ， 此 种 方法 与 其 他 方法 相 比 是 最 优 的 ， 内 容 将 预先 从 源 服务 器 推送 至 代理 
缓存 服务 器 。 当 收 到 用 户 请 求 时 ， 若 代理 缓存 服务 器 有 目标 副本 ， 则 可 以 迅速 响应 该 
用 户 请 求 ; 若 代理 缓存 服务 器 没有 目标 副本 ， 其 转向 拥有 该 副本 的 最 近 的 代理 缓存 服 
务 器 来 响应 用 户 请 求 。 铬 被 请 求 的 目标 文件 在 所 有 代理 缓存 服务 器 中 都 没有 副本 ， 则 
转向 源 服 务 器 。 这 种 方法 要 求 的 代理 缓存 服务 器 间 的 协作 会 带 来 额外 的 通信 成 本 和 管 
理 成 本 ， 但 这 些 成 本 也 被 代理 缓存 服务 器 间 带 宽 共 享 和 减少 复制 元 余 所 带 来 的 优势 抵 
消 了 。 同 时 ， 这 种 方法 也 可 以 减少 维护 缓存 一 致 性 的 成 本 。 

表 14. 1 列举 了 典型 CDN 和 移动 CDN 的 主要 区 别 。 


表 14.1 典型 CDN 和 移动 CDN 的 对 比 





内 容 类 型 fr. asi 
meum sanis 
代理 缓存 服务 器 定位 固定 的 
代理 缓存 服务 器 拓扑 靠近 基站 
副本 维护 费用 中 高 
面向 地 理 定位 的 应 用 服 
wil duod 务 ; 面向 用 户 的 服务 
内 容 外 包 策略 协作 推送 法 


综 上 所 述 ， 一 个 移动 CDN 应 该 由 以 下 几 个 部 分 组 成 : 

1) 分 布 于 世界 各 地 的 一 系列 代理 缓存 服务 器 ， 用 来 缓存 源 服务 器 内 容 。 代 理 组 
存 服 务 器 是 非 移动 性 的 ， 而 且 位 于 移动 基站 附近 。 

2) 一 个 网 络 设施 (有线 和 无 线 ) ， 负 责 将 内 容 请 求 转 到 最 优 地 点 和 最 优 的 代理 


缓存 服务 器 。 
3) 监测 网 络 设施 的 机 制 ， 负 责 实 时 监测 有 效 带宽 、 反 应 时 间 和 其 他 资源 拥塞 
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情况 。 

4) 缓存 管理 器 ， 用 来 有 效 管 理 上 传 到 代理 缓存 服务 器 的 内 容 。 

5) 内 容 位 置 管理 器 ， 负 责 管理 内 容 的 位 置 和 数据 预 取 调度 。 

6) 记 账 机 制 ， 向 源 服务 器 和 CDN 提供 商 提 供 日 志和 相关 信息 。 

以 上 各 个 部 分 互相 协作 来 将 目标 内 容 分 发 至 移动 用 户 。 在 这 里 ， 内 容 指 一 个 随时 
间 变 化 的 目标 集 。 例 如 ， 内 容 可 以 是 一 个 特定 的 网 站 、 一 个 流 服务 、 一 个 网 页 服务 或 
任何 分 布 式 应 用 的 集合 。 当 移动 用 户 需要 请 求 某 个 目标 内 容 时 ， 用 户 的 请 求 被 立刻 送 
至 在 地 理 意义 上 最 邻近 的 代理 缓存 服务 器 。 如 果 这 个 代理 缓存 服务 器 恰好 存 有 这 个 目 
标 内 容 ， 请 求 会 立刻 得 到 响应 。 和 否则， 移动 CDN 将 转向 拥有 该 目标 副本 的 最 近 的 代 
理 缓 存 服务 器 来 响应 用 户 请 求 。 

针对 用 户 请 求 的 高 可 变性 和 内 容 动态 变化 的 特性 ， 移 动 CDN 必须 将 内 容 管 理 策 
略 整合 到 代理 缓存 服务 器 的 缓存 中 。 如 何 选择 外 包 内 容 多 R n fp Sch Pet E 
有 不 同 的 方法 。 缓 存 管理 器 负责 有 选择 地 将 内 容 复 制 到 代理 缓存 服务 器 ， 并 且 保 持 内 
容 的 更 新 。 特 别 地 ， 需 要 注意 缓存 一 致 性 的 问题 ， 详 细 内 容 可 参见 参考 文献 [30]. 
PRA, 为 了 应 对 用 户 请 求 的 临时 变化 ， 缓 存 管理 器 需 进 行 周期 性 检查 。 另 外 ， 内 容 位 
置 管 理 器 负责 将 外 包 的 内 容 复 制 到 代理 缓存 服务 器 。 最 后 还 需要 一 个 可 以 实时 监控 用 
户 状态 的 机 制 ， 因 为 用 户 很 有 可 能 由 于 处 于 移动 状态 而 不 能 接收 到 其 请 求 的 内 容 。 

考虑 到 CDN 的 市 场 情况 ， 尽 管 在 市 面 上 已 经 有 了 一 些 CDN RAS, 但 是 移动 
CDN 提供 商 还 是 很 少 。 据 本 章 作 者 所 知 ，Ortiva Wireless? 是 目前 仅 有 的 一 家 移动 
CDN 提供 商 ， 能 够 在 高 变化 度 的 无 线 网 络 覆 盖 条 件 下 将 视频 传递 给 移动 用 户 。 通 过 
对 移动 电视 、 视 频 、 音 频 、 网 页 内 容 的 分 发 进行 优化 ，Ortiva 可 以 在 任何 无 线 网 络 间 
高 质量 地 传输 数据 ， 在 没有 对 网 络 基础 设施 进行 大 幅度 更 改 的 情况 下 ，Ortiva 实现 了 
业务 、 和 覆盖面 和 网 络 容量 的 拓展 。 


14.4 移动 CDN 的 无 线 网 络 设 施 


如 前 所 述 ， 移动 CDN 的 网 络 设施 可 以 分 解 为 无 线 设施 和 有 线 设 施 。 有 线 设 施 提 
供 CDN 所 要 求 的 适应 性 和 容错 性 ，CDN 的 一 大 部 分 位 于 互联 网 的 主干 网 处 ,需要 进 
行 高 见 余 度 的 配置 。 这 一 节 重点 描述 现 有 的 两 种 无 线 网 络 设施 ”， ， 并 讨论 它们 在 移 
动 CDN 中 的 适用 性 。 


14. 4.1 在 集中 式 无 线 网 络 设施 下 的 移动 CDN 


蜂窝 网 络 和 Wi — Fi 网 络 是 两 个 典型 的 集中 式 无 线 网 络 设施 。 从 图 14. 2 可 以 看 到 ， 
所 有 的 用 户 均 与 一 个 中 心 进行 通信 。 在 蜂窝 网 络 内 ， 中 心 通常 是 一 个 3G 或 CSM 的 基站 
(BS), fr Wi -Fi 网 络 中 则 是 IEEE 802.11 BEAK (AP)57) 。 无 论 是 基站 还 是 接 入 点 ， 


O 现 有 CDN 提供 商 的 完整 列表 参见 参考 文献 【29] 。 一 一 原 书 注 
© http: //www. ortivawireless, com/, 一 一 原 书 注 
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都 作为 无 线 用 户 的 硬件 桥梁 来 负责 无 线 通道 的 分 配 和 控制 。 另 外 ， 基 站 / 接 人 点 持续 跟 
踩 用 户 ， 这 样 可 以 当 用 户 不 在 无 线 覆 盖 范 围 内 或 下 线 时 停止 内 容 的 分 发 。 





A IEEE802.11 Wi-Fi 
IE 


图 14. 2 集中 式 无 线 网 络 设施 


集中 式 的 无 线 网 络 设施 为 移动 CDN 提供 了 一 个 很 好 的 架构 。 例 如 ， 图 14. 2 中 的 用 
P A 拥有 一 部 内 置 摄像 头 的 手机 (已 人 网 登记 ) A 目前 正在 度假 ， 他 /她 拍 了 一 个 观 
光 视 频 ， 并 想 将 这 个 视频 上 传 至 在 线 博 客 ， 这 样 Wi - Fi 网 络 的 用 户 B 和 C 就 可 以 访问 
该 视频 了 。 只 要 用 户 A 在 蜂窝 网 络 的 覆盖 范围 内 ， 就 可 以 通过 手机 将 视频 传输 到 这 个 区 
域 的 基站 上 。 接 下 来 ， 基 站 将 这 个 视频 通过 蜂窝 网 络 发 送 到 博客 的 托管 服务 器 上 。 移 动 
CDN 提供 商 就 负责 将 这 个 视频 推送 至 离 用 户 B A C 尽 可 能 近 的 Wi - Fi 网 络 中 。 

但 是 ， 这 种 集中 式 无 线 网 络 也 存在 几 个 问题 。 负 责 协调 无 线 环境 下 通信 的 集中 式 管 
理 机 构 限 制 了 移动 环境 中 的 可 扩展 性 和 适应 性 "” 。 所 以 ， 为 了 能 够 满足 通信 覆盖 和 提 
供 服务 质量 (QoS) ， 在 配置 时 需要 慎重 对 待 ， 并 通过 系统 化 的 方式 进行 。 


14.4.2 在 Ad - Hoc 无 线 网 络 设 施 下 的 移动 CDN 


与 集中 式 网 络 设施 相 比 ，Ad - Hoc 无 线 网 络 设施 在 移动 环境 下 具有 几 个 优点 。 从 技 
术 的 角度 讲 ，Ad - Hoc 无 线 网 络 由 自治 节点 组 成 ， 节 点 间 通 过 无 线 点 对 点 连接 进行 内 部 
通信 。 通 信 通 过 多 跳 方式 进行 ， 不 依赖 于 任何 一 个 中 心机 构 来 负责 信道 分 配 、 拓 扑 信息 
或 者 内 容 分 发 。 与 集中 式 网 络 相 比 ， 在 用 户 数量 增加 时 Ad - Hoc 网 络 的 扩展 可 以 采用 
一 个 经 济 上 划算 的 解决 方案 ，”"”。 这 两 种 网 络 类 型 的 主要 区 别 参见 表 14. 2。 
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3214.2 集中 式 无 线 设施 与 Ad - Hoc 无 线 网 络 设 施 对 比 表 
"o dE 集中 式 无 线 设 施 Ad - Hoc 无 线 设施 


X 
容错 能 力 (访问 点 是 一 个 单 点 失效 ) “| 有 


节点 数 增加 时 的 可 扩展 性 无 








节点 的 自 组 织 和 自 配置 x 有 
维护 和 扩张 成 本 高 ; 需要 额外 访问 点 低 
中 央 控制 机 构 访问 点 /基站 x 
访问 点 或 基站 
桥接 pedis 每 个 节点 都 充当 其 他 节点 的 桥 (软件 桥 ) 


移动 Ad - Hoc 网 络 (MANET) 是 一 个 以 点 对 点 和 P2P 方式 建立 起 来 的 无 线 网 络 ， 
具有 动态 和 任意 的 拓扑 结构 ， 实 现 信息 检索 和 分 发 。MANET 的 基本 特性 如 下 所 示 : 

(1) Ad - Hoc 和 P,P 网 络 的 连接 性 

这 样 的 网 络 具 有 自 组 织 和 自 配置 的 能 力 。Ad - Hoc 设施 是 非 集中 式 的 ， 不 依赖 于 任 
何 固定 设施 。 非 中 心 化 的 架构 突出 了 网 络 的 容错 性 ,不 会 出 现 单 点 失效 。 另 外 ， 
Ad - Hoc 的 连接 性 保证 了 网 络 的 可 扩展 性 ， 因 为 没有 必要 再 去 建立 额外 的 网 络 设施 。 它 
们 的 这 种 连接 特性 是 由 设施 的 Ad - Hoc 连接 本 质 决定 的 ， 任 何 节点 在 网 络 中 的 地 位 都 
是 平等 的 ， 在 任何 时 候 一 个 节点 既 可 以 是 主机 也 可 以 是 路 由 器 '”。 

(2) 网 络 拓扑 

动态 性 来 自 节点 组 织 的 不 可 预知 性 和 随机 性 。 更 进一步 说 ， 这 是 由 于 移动 节点 在 给 
定 的 任何 时 间 点 能 够 加 入 或 离开 无 线 网 络 ， 而 无 须 预先 通知 网 络 。 固 定 节点 可 以 与 移动 
节点 建立 对 等 ， 给 其 他 固定 设施 或 互联 网 提供 网 关 功 能 。 

(3) 移动 节点 约束 

移动 节点 依赖 于 充电 电池 的 供电 ， 这 就 意味 着 其 续航 时 间 是 有 限 的 。 另 外 ， 它 们 的 
处 理 和 存储 能 力也 由 于 它们 的 尺寸 相对 较 小 而 受 限 。 

由 于 在 快速 变化 、 非 确定 性 的 移动 环境 下 移动 Ad - Hoc 网 络 的 设施 对 于 信息 发 布 有 
卓越 的 性 能 "， 因 而 MANET 引起 了 研究 人 员 和 业界 的 重视 。 如 图 14. 3 所 示 ， 用 户 A 希 
望 在 一 个 多 媒体 在 线 网 店 (在 移动 CDN 上 已 经 注册 入 网 ) 下 载 一 个 视频 到 其 笔记 本 电脑 。 
但 是 ， 由 于 他 /她 此 时 正 处 于 Wi -Fi 或 蜂窝 网 络 提供 商 的 无 线 覆盖 范围 外 ， 所 以 他 /她 转 
换 到 Ad - Hoc 模式 ， 加 入 到 由 用 户 B、C、D、F 组 成 的 MANET 中 2? 。 注 意 到 用 户 眉 也 是 
MANET 网 络 中 的 一 部 分 ， 并 且 可 以 使 网 络 中 的 其 他 成 员 连 接 到 互联 网 ， 所 以 用 户 A 的 请 
求 就 通过 MANET 先 传递 到 用 户 下 ， 再 从 了 传递 至 多 媒体 在 线 网 店 。 然 后 ， 相 应 的 移动 
CDN 会 受理 请 求 并 将 请 求 转 至 与 用 户 卫 最 邻近 的 代理 缓存 服务 器 上 。 为 了 补偿 移动 节点 的 
局 限 性 ， 上 述 移动 CDN 会 以 特定 的 编码 及 压缩 方式 提供 这 个 视频 。 


〇 ”安全 问题 及 用 户 之 间 的 信任 问题 在 无 线 Ad - Hoc 网 络 中 非常 重要 ， 但 这 不 是 本 章 的 内 容 。 一 一 原 书 注 
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图 14.3 一 个 典型 的 Ad - Hoc 无 线 网 络 设施 


MANET 的 一 个 特例 是 车 辆 Ad - Hoc 网 络 (VANET) ， 是 由 受 道路 约束 的 车 辆 和 
固定 在 路 边 的 提供 位 置 服务 和 互联 网 网 关 功 能 的 节点 组 成 。 特 别 地 ，VANET 是 为 了 
实现 智能 交通 系统 而 开发 的 一 个 相应 的 设施 。VANET 与 MANET ALA FAR: 

(1) 网 络 拓扑 

由 于 车 辆 的 移动 性 更 强 ，VANET 比 MANET 更 动态 化 。 但 是 ，VANET 中 车 辆 节 
点 的 移动 可 以 预见 ， 因 为 它们 通常 都 在 特定 的 道路 范围 内 ， 以 相对 规范 的 方式 行驶 。 
与 MANET 一 样 ， 路 边 节 点 与 车 辆 节点 进行 对 等 互联 ， 并 作为 固定 设施 和 互联 网 的 网 
关 。 同 时 ， 路 边 节点 可 向 车 辆 节点 广播 位 置信 息 。 

(2) BAAR 

VANET 没有 电源 和 续航 时 间 的 约束 ， 因 为 车 辆 节点 由 车 载 电源 持续 供电 。 

下 面 将 介绍 将 移动 CDN 技术 应 用 到 VANET 中 的 好 处 。 例 如 ， 车 辆 V ，…，YV: 
加 入 了 一 个 VANET， 假 设 V, 与 Vs 在 路 口 处 发 生 交通 事故 ，V4 和 V; 立 刻 向 网 络 的 其 他 
成 员 广 播 有 关 事 故 的 照片 或 录像 信息 。 该 警示 信息 被 标记 为 高 优先 级 ， 并 在 VANET 
中 进行 传播 。 当 V 收 到 警示 信息 后 ， 它 利用 附近 的 互联 网 基站 将 这 起 交通 事故 传送 
至 在 线 交通 监控 系统 。 移 动 CDN 会 将 这 个 配 有 照片 和 录像 的 警示 信息 传送 至 代理 组 
存 服务 器 。 这 使 得 应 急事 件 小 组 可 以 在 最 短 的 时 间 内 对 事故 有 全 面 的 了 解 。 同 时 ， 当 
其 他 正 驶 向 事故 地 点 的 车 辆 通过 车 辆 监控 系统 看 到 这 个 警示 信息 后 ， 可 以 采取 改变 路 
线 等 措施 来 避免 拥堵 。 一 般 而 言 ， 移 动 CDN 在 交通 环境 中 的 作用 包括 : 

1) 通过 移动 互联 网 向 车 辆 提供 动态 内 容 和 流 内 容 。 

2) 向 有 关 车 辆 和 机 构 发 布道 路 交通 信息 ， 如 拥 墙 、 交 通 事故 和 临时 绕 行 等 信息 。 

3) 定位 服务 ， 如 各 种 场所 的 位 置信 息 (如 宾馆 、 饭 店 、 加 油 站 、 停 车 场 等 ) 。 

4) 将 车 辆 传感器 收集 到 的 环境 测量 信息 进行 发 布 。 
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5) 支持 分 布 式 游 戏 。 
最 后 ， 表 14.3 列举 了 VANET 与 MANET 的 主要 区 别 。 
表 14.3 MANET 与 VANET 对 比 表 


特 性 MANET VANET 
移动 节点 笔记 本 计算 机 、 智 能 手机 、PDA 车 辆 











节点 移动 性 有 组 织 的 - 可 预测 的 (在 道路 约束 下 ) 
节点 约束 性 有 限 (和 电池 约束 相关 ) 不 存在 电源 不 足 问 题 
移动 性 十 分 高 
网 络 拓扑 动态 
支持 的 网 络 技术 UMTS, GSM, Wi-Fi, Bluetooth DSRC, UMTS, GSM, Wi-Fi 


14.5” 写 给 使 用 者 


现 有 文献 中 已 经 针对 学 术 界 和 业界 中 的 若干 项 目 进行 了 研究 ， 具 体内 容 是 在 源 服 
务 器 与 移动 节点 间 开 发 并 部 署 中 间 组 件 ， 以 便 进行 两 者 之 间 的 无 缝 信息 发 布 ”。 这 
些 中 间 组 件 配置 在 无 线 设 施 中 ， 以 优化 网 络 连接 和 带宽 利用 率 。 这 一 节 将 介绍 移动 环 
境 中 使 用 中 间 组 件 的 有 关 方 法 ， 以 及 如 何 将 这 些 方法 应 用 到 移动 CDN 中 。 

IBM 的 Web Express 系统 采用 了 客户 端 一 拦截 一 服务 器 的 无 线 计算 模型 ” ， 对 资 
源 有 限 的 移动 节点 的 网 页 访问 进行 优化 。 这 个 模型 利用 优化 通信 的 拦截 技术 来 改善 无 线 
连接 的 响应 时 间 。 具 体 来 说 ，Web Express 系统 有 两 个 关键 组 件 : 配置 在 移动 节点 的 客 
户 端 拦截 (CSI) 组 件 和 配置 无 线 网 络 的 服务 器 端 拦截 (SSI) 组 件 。CSI 截获 移动 节点 
的 请 求 ， 并 与 SSI 进行 协作 来 减少 数据 传输 量 ， 改 善 内 容 在 无 线 连接 中 的 可 用 性 。Web 
Express 系统 采用 了 若干 种 优化 方法 来 解决 在 客户 端 CSI 与 服务 器 端 SSI 缓存 、 计 算 已 有 
缓存 内 容 与 新 响应 间 差 别 、 在 单一 会 话 下 的 请 求 复 用 以 及 缩小 HTTP 头等 问题 。 

作者 认为 ， 在 移动 内 容 网 络 的 应 用 中 ，Web Express 系统 或 更 特定 的 客户 端 /拦截 模 
型 可 以 采用 将 CSL 从 源 服务 器 移 至 代理 缓存 服务 器 的 方法 。 重 定位 可 以 进一步 地 减 小 移 
动用 户 通过 无 线 网 络 的 网 页 访问 时 长 ， 通 过 上 述 的 优化 方法 也 可 以 减轻 网 络 拥堵 。 

Dikaiakos 等 人 提出 了 一 个 独立 的 信息 传输 协议 ,在 VANET 中 的 车 辆 和 路 边 固定 节 
点 间 传 播 信息 。 车 辆 信息 传输 协议 〈VITP) 是 一 个 属于 应 用 层 的 无 状态 协议 ， 它 规定 了 车 
辆 节点 间 通 信和 的 语法 及 语义 ， 但 同时 又 隶属 于 VANET 协议 。 他 们 提出 的 方法 将 VITP 配置 
到 车 辆 上 来 支持 基于 位 置 和 面向 交通 的 服务 。 也 就 是 说 ， 查 询 请 求 被 传输 到 一 个 特定 的 地 
理 区 域 来 检索 所 需 的 内 容 。 在 这 个 目的 地 (目标 ) 位 置 内 ， 一 个 名 为 虚拟 Ad - Hoc 服务 
fis (VAHS) 的 动态 集 被 立刻 建立 ， 用 来 计算 对 位 置 查询 的 响应 。 当 返回 条 件 满足 时 ， 
VAHS 中 的 节点 彼此 协作 ， 发 送 一 个 对 VITP 请 求 的 响应 。VITP 查询 按照 请 求 一 响应 的 原 
则 进行 。 另 外 ， 协 议 通过 缓存 控制 头 〈 包 含 在 VITP 查询 请 求 中 ) 进行 数据 缓存 。 如 果 在 
一 个 对 等 节点 的 缓存 服务 器 中 存在 一 个 满足 VITP 查询 的 内 容 ， 这 个 节点 就 可 以 使 用 上 述 
头 来 决定 是 使 用 本 地 缓存 进行 响应 还 是 向 目标 位 置 重 传 查询 命令 。 

在 移动 CDN 中 ， 路 边 固定 的 VITP 节点 可 以 作为 代理 缓存 服务 器 使 用 。 与 车 辆 相 
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比 ， 这 样 的 节点 有 更 强 的 处 理 和 存储 能 力 、 更 大 的 无 线 电波 覆盖 范围 和 连续 的 高 带宽 
互联 网 连接 。 每 一 个 路 边 节 点 可 以 被 指定 为 负责 该 区 域 的 代理 缓存 服务 器 ， 因 此 这 些 
代理 缓存 服务 器 可 以 缓存 频繁 的 VITP 信息 和 位 置信 息 。 

另外 ,移动 CDN 可 以 向 现 有 车 辆 应 用 提供 服务 ， 如 CarNet" 、TrafficView "74$, 
特别 地 ，CarNet 是 最 早 应 用 内 容 分 发 技术 来 提供 车 辆 服务 的 应 用 之 一 。 另 外 ，Traffic- 
View 也 是 一 个 典型 的 CDN 框架 ， 用 来 进行 交通 信息 、 路 况 信 息 、 路 线 规划 信息 和 应 
急 信息 等 内 容 的 发 布 。TraffieView 可 以 显示 实时 动态 的 交通 状况 ， 以 作为 传统 的 车 载 
GPS 的 有 效 补充 。 

最 后 ，Daly 和 Haahr 提出 使 用 运行 有 SimBet 路 由 算法 的 中 间 组 件 来 对 MANET 
中 的 信息 发 布 进行 改进 。SimBet 使 用 一 个 基于 社会 网 络 分 析 的 指标 来 确定 在 网 络 中 移 
动 节点 的 中 心 。 为 了 找到 中 心 节点 ，SimBet 使 用 一 个 称 为 中 介 中 心性 ( betweenness 
centrality) 的 概念 。 所 以 ， 如 果 发 送 节 点 不 知道 目标 节点 ， 信 息 就 会 被 路 由 到 中 心 节 
点 。 对 于 移动 CDN， 这 个 方法 可 以 被 应 用 在 某 个 节点 上 ， 这 样 就 可 以 将 被 请 求 的 内 
容 发 送 到 无 线 网 络 中 的 中 心 节点 ; 当 用 户 请 求 的 内 容 正 好 暂时 不 在 覆盖 范围 之 内 
(或 掉 线 ) 时 ， 这 个 方法 就 可 以 派 上 用 场 。 


14.6 实施 和 实验 


在 实际 设计 和 实施 一 项 新 技术 之 前 ， 首 先 要 对 实际 情况 下 的 策略 和 应 用 、 实 现 、 
CDN 设施 进行 一 系列 仿真 实验 。 之 所 以 要 进行 仿真 ， 是 因为 在 真实 环境 中 进行 实时 
的 实验 非常 困难 。 从 实现 角度 来 看 ， 以 下 几 种 仿真 方法 可 以 用 来 评估 一 个 移动 CDN 
设施 的 性 能 : 

(1) 仿真 测试 平台 

大 规模 的 仿真 测试 平台 为 新 的 CDN 技术 、 策 略 、 应 用 的 实现 和 评估 提供 了 一 个 
必要 的 设施 。 如 PlanetLab? 就 是 一 个 节点 遍布 全 球 各 地 的 全 球 性 覆盖 网 。 事 实 上 ， 
PlanetLab 可 作为 一 个 CDN 测试 平台 ， 用 于 配置 一 个 全 球 性 的 服务 和 跨越 全 球 范 围 的 
应 用 。 这 个 CDN 测试 平台 由 高 性 能 的 代理 缓存 服务 器 网 组 成 ， 在 许多 PlanetLab 节点 
上 都 配置 了 这 样 的 代理 缓存 服务 器 。 在 PlanetLab 之 上 已 经 建 有 两 个 学 术 性 CDN: 
CoDeeN 和 Coral”。 学 术 性 CDN 在 第 1 章 已 经 给 出 了 详细 的 介绍 。 

(2) 仿真 软件 

一 般 来 说 ， 在 所 有 的 科学 研究 领域 里 ， 仿 真 软件 都 是 产品 设计 和 测试 的 必 备 工 
具 。CDN 仿真 器 也 毫 无 例外 地 成 为 CDN 研究 和 业界 中 的 必 备 品 。 这 些 工 具 为 模拟 
CDN 应 用 和 设施 提供 了 手段 ， 但 是 没有 任何 具体 支出 ， 也 不 需 进 行 硬件 的 安装 和 配 
置 ， 仿 真 结果 是 可 复 现 的 ， 也 便于 分 析 ， 因 为 仿真 环境 不 存在 不 可 预料 和 不 可 控 的 影 








C) http: //www. planet-lab. org; 一 一 原 书 注 
© http: //codeen. cs. princeton. edu, 原 书 注 
© http; //www. coralcdn. orgo 原 书 注 
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响 因素 (如 不 希望 的 外 部 流量 ) 。 相 反 ， 在 实际 网 络 设施 中 ， 研 究 人 员 则 可 能 会 遇 到 
上 述 影响 因素 。CDN 仿真 器 模拟 一 系列 的 计算 机 行为 ， 也 就 是 说 ， 代 表 一 台 源 服务 
器 向 用 户 可 人 靠 和 高 效 地 分 发 内 容 。 本 书 第 5 章 介 绍 了 一 个 仿真 分 析 工 具 CDNsim。 

但 是 ， 上 述 的 CDN 仿真 软件 和 测试 平台 只 考虑 了 固定 、 有 线 的 网 络 设施 ， 并 不 
支持 移动 CDN 的 仿真 和 评估 ， 因 为 在 这 些 软 件 中 没有 考虑 到 用 户 的 移动 性 、 无 线 传 
输 媒介 和 其 他 在 14.3 节 中 提 到 的 移动 特性 。 作 者 认为 ,这些 CDN 仿真 软件 或 测试 平 
台 应 该 通过 开发 新 的 可 扩展 的 模块 来 支持 移动 CDN。 这 些 模块 应 能 够 提供 : 

(1) 真实 的 移动 性 轨迹 

为 了 实现 移动 节点 的 移动 行为 模拟 ， 可 以 通过 常见 的 移动 模型 来 产生 一 系列 的 移 
动 轨迹 。 例 如 ， 一 个 支持 产生 移动 轨迹 的 模块 可 以 集成 SUMO 的 相关 功能 ”。SUMO 
是 一 个 知名 的 微型 便携 式 交通 模拟 器 ， 它 可 以 模拟 城市 环境 下 车 辆 行为 的 移动 轨迹 。 
另外 ， 相 关 模 块 的 研究 人 员 可 以 考虑 CosMos， 这 是 一 个 由 Günes 和 Siekermann ^ $ë 
出 的 通信 和 移动 情景 模拟 器 。 与 其 他 基于 单一 移动 模型 的 移动 轨迹 产生 器 不 同 ，Cos- 
Mos 集成 了 几 个 移动 性 模型 ， 所 以 它 可 以 为 无 线 网 络 仿真 提供 更 真实 的 移动 模式 。 

(2) 无 线 环 境 的 支持 

如 本 章 前 面 所 提 到 的 ， 无 线 环 境 与 有 线 环境 呈现 着 不 同 的 特性 。 因 此 ， 模 拟 无 线 
环境 下 的 特性 对 于 移动 CDN 的 仿真 和 评估 至 关 重要 。 支 持 无 线 环境 的 新 模块 应 该 能 
够 准确 地 模拟 设施 和 Ad - Hoc 环境 下 的 振荡 信号 强度 、 带 宽 、 间 歇 性 、 连 接 性 。 甚 
至 ， 这 种 模型 可 以 进一步 用 于 模拟 波 的 传播 特性 ， 如 多 径 、 衰 减 和 衍射 特性 。 

(3) 移动 资源 受 限 的 支持 

移动 CDN 模拟 器 应 该 考虑 移动 节点 的 一 个 重要 的 特点 ， 即 可 用 资源 的 有 限 性 。 
具体 地 说 ， 组 成 移动 CDN 的 大 多 数 节点 都 受到 功率 限制 。 所 以 ， 应 该 开发 在 不 同 的 
情景 下 (ER, RX., Rk SWERE) 节点 的 能 耗 模型 ， 并 在 新 的 模块 中 实现 。 
这 样 的 模型 最 终 将 用 来 正确 地 模拟 在 上 述 限制 条 件 下 移动 节点 的 行为 ， 并 允许 用 来 试 
验 各 种 节能 技术 。 

ORBITO 是 一 个 支持 无 线 技术 研究 的 无 线 网 络 测试 平台 ， 由 若干 大 规模 无 线 网 络 
组 成 ， 网 络 中 含有 400 个 支持 高 速 蜂窝 (3G) A IEEE 802. 11 协议 的 节点 。 与 其 他 大 
型 测试 平台 相 比 ，ORBIT 的 优点 在 于 支持 移动 仿真 ， 而 移动 性 是 通过 布朗 运动 或 随机 
路 径 点 模型 得 到 的 ， 这 就 具备 了 仿真 各 种 无 线 应 用 和 无 线 技术 (Ul MANET 和 面向 位 
置 服务 ) 的 能 力 。 

从 试验 的 角度 看 ， 我 们 希望 无 线 CDN 可 以 减少 用 户 的 平均 响应 时 间 ， 增 加 代理 
缓存 服务 器 缓存 字 节 命中 率 。 一 方面 ， 平 均 响应 时 间 代表 用 户 等 待 请 求 响应 的 时 间 ， 
男 一 方面 ， 字 节 命中 率 代表 着 网 络 的 性 能 。 另 外 ， 我 们 期 望 移动 CDN 中 的 代理 缓存 
服务 器 可 以 借助 彼此 之 间 高 度 的 协作 性 而 具备 较 低 的 复制 宛 余 度 。 这 一 点 非常 重要 ， 
因为 高 数据 元 余 度 会 浪费 CDN 提供 商 的 资金 。 最 后 ， 我 们 期 望 移动 CDN 能 够 通过 


O 下 一 代 无 线 网 络 开放 访问 研 究 测试 平台 (Open - Access Research Testbed for Next — Generation Wireless 
Networks), BL http: //www. orbit — lab. orgo 原 书 注 
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响应 大 多 数 用 户 请 求 来 改善 对 移动 用 户 的 服务 质量 。 如 果 没 有 这 样 一 个 设施 ,许多 移 
动用 户 将 面临 服务 被 拒绝 的 情况 。 


14.7 未 来 研究 方向 


移动 无 线 网 络 的 特点 是 用 户 需求 的 多 变性 ， 以 及 动态 内 容 和 多 媒体 应 用 的 高 需求 
性 。 例 如 ， 一 个 司机 就 希望 能 在 旅程 中 收 到 任何 关于 紧急 情况 的 多 媒体 信息 。 移 动 无 
线 网 络 的 另 一 个 特点 是 资源 的 缺乏 性 ， 例 如 某 用 户 希 望 将 一 段 视 频 上 传 至 服务 器 以 腾 
出 存储 空间 拍摄 更 多 的 照片 或 录像 。 上 述 问题 必须 得 到 解决 ， 接 下 来 将 探讨 移动 
CDN 未 来 的 研究 方向 : 内 容 放置 技术 、 动 态 内 容 和 移动 流 媒体 的 发 布 技术 。 


14.7.1 内 容 放置 技术 


内 容 放置 技术 解决 的 是 内 容 被 复制 到 何 处 的 问题 ， 可 以 通过 一 些 基 于 请 求 和 资源 
约束 的 目标 函数 进行 优化 设计 。 对 静态 用 户 需 求 而 言 ， 这 个 问题 已 经 得 到 了 详细 的 研 
gi 7775 但 是 ， 由 于 移动 性 和 资源 的 约束 ， 现 有 的 方案 并 不 适用 于 移动 无 线 环 
境 。 所 以 ， 必 须要 研究 针对 于 动态 内 容 、 多 媒体 应 用 和 用 户 移动 性 的 新 方法 。 

针对 动态 用 户 需 求 的 内 容 放置 方法 是 关注 的 重点 "“”” Chen SA Ht T— 
种 动态 放置 副本 的 算法 ， 该 算法 利用 有 限 的 网 络 拓扑 知识 将 副本 动态 地 放置 和 组 织 为 
一 个 应 用 层 的 组 播 树 ， 旨 在 兼顾 用 户 等 待 时 间 和 服务 器 容量 。 在 参考 文献 [25] 中 ， 
作者 提出 另外 一 种 动态 内 容 放置 框架 ， 将 动态 内 容 放置 的 优化 问题 描述 为 一 个 半 马 尔 
可 夫 决 策 过 程 ， 用 户 的 请 求 被 假定 服从 马尔 可 夫 模型 。Presti 4& AU" 利用 非 线性 整数 
规划 方程 来 解决 动态 内 容 放置 的 问题 。Rabinovich 等 人 "使 用 应 用 CDN (Application 
CDN，ACDN) 来 进行 动态 内 容 分 发 ， 提 出 了 一 个 基于 用 户 历 史 需 求 的 启发 式 方法 。 

但 是 ， 以 上 的 内 容 放 置 技术 都 没有 在 无 线 网 络 设施 上 进行 过 评估 。 鉴 于 此 ， 参 考 
文献 [1] 针对 移动 CDN 提出 了 在 线 启发 式 动态 内 容 放 置 算法 ( 称 为 在 线 MDCDN ) ， 
该 算法 是 基于 二 次 指数 平滑 (DES) 的 统计 预测 方法 ,通过 用 户 需 求 的 变化 来 预测 每 
一 个 代理 缓存 服务 器 的 未 来 需求 。 这 些 预 测 被 用 来 决定 是 否 需 要 添加 一 个 新 的 内 容 副 
本 或 者 需要 移 除 一 个 已 有 的 内 容 副 本 ， 以 最 小 化 网 络 主干 的 总 体 流量 。 为 了 进行 验 
证 ,作者 使 用 了 一 个 移动 仿真 器 “和 一 个 20km 半径 的 城市 模型 ， 城 市 模型 根据 人 口 
密度 和 自然 约束 (如 河流 、 公 路 等 ) 被 划分 为 若干 个 区 域 。 

Miranda 等 人 '” 提 出 了 一 个 称 为 DbC 的 分 布 式 算法 ,将 内 容 尽 可 能 均匀 地 放置 到 
无 线 Ad - Hoc 网 络 中 的 所 有 服务 器 上 。 这 样 ， 数 据 的 副本 之 间 都 放置 的 足够 远 来 防 
止 出 现 过 度 宛 余 。 另 外 ， 副 本 对 于 每 一 个 终端 用 户 又 相距 足够 近 ， 这 就 改善 了 信息 传 
播 。 仿真 结 果 表 明 ，DbC 改善 了 整个 网 络 的 数据 传播 。 另外， 在 参考 文献 [17] 中 
提出 了 三 种 有 效 的 无 线 对 等 网 络 设施 内 容 放置 技术 ， 这 些 方法 将 副本 放置 在 移动 主机 
上 ， 分 别 考虑 了 对 象 的 PT AS (扩展 静 态 访问 频率 ，E - SAF) 、 对 象 与 相 邻 移动 主机 


O PT 值 被 定义 为 距 下 次 对 象 更 新 的 所 剩 时 间 与 对 象 流行 度 的 乘积 。 一 一 原 书 注 
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的 PT 值 (扩展 动态 访问 频率 和 邻近 度 , E- DAFN)、 或 者 对 象 与 整个 网 络 拓扑 的 PT 
值 (基于 扩展 动态 连接 性 的 分 组 ，E - DCG ) 。 参 考 文献 [17] 中 的 实验 表明 , E- 
DCG 具有 最 高 的 访问 能 力 ， 而 卫 - SAF 方法 的 流量 最 低 。 


14.7.2 动态 内 容 的 分 发 


分 发 动态 内 容 的 应 用 对 延 时 非常 敏感 。 例 如 ， 一 个 司机 想 知道 走 哪 条 路 才 可 以 避 
免 交 通 拥堵 ， 在 这 种 情况 ， 哪 怕 是 几 秒 钟 的 延 时 都 是 不 能 容忍 的 。 所 以 ， 移 动 环境 下 
动态 内 容 的 有 效 分 发 具有 相当 重要 的 意义 。 为 了 解决 这 个 问题 ， 研 究 人 员 提 出 了 很 多 
方法 和 技术 来 加 速 动 态 内 容 的 分 发 (… “六 ， 这 些 方法 在 某 些 商业 系统 (如 IBM 的 
Websphere 边缘 服务 9 和 Akamai 的 EdgeSuite 4°) 中 的 应 用 已 经 证 明了 动态 内 容 分 
发 技术 的 重要 性 和 有 效 性 。 

近 些 年 基于 片段 的 策略 引起 了 学 术 界 的 广泛 重视 一” 。 实 验 结果 显示 ， 用 片段 组 
成 网 页 比 从 头 构建 一 个 网 页 具有 更 低 的 开销 5 。Akamai 也 使 用 了 ESI (Edge Side In- 
cludes) 技术 来 增强 基于 片段 的 策略 。Ramaswamy 等 人 ”提出 了 一 个 在 动态 产生 的 网 
页 中 能 自动 检测 和 标记 感 兴趣 片段 〈 即 低 成 本 的 缓存 单元 ) 的 新 方法 ， 其 要 点 是 如 
果 一 个 片段 被 多 个 网 页 分 享 或 它 受 关 注 的 时 间 长 ， 或 本 身 具 有 个 性 化 的 特点 ， 那 么 它 
就 会 被 当做 感 兴趣 的 片段 。 

还 有 一 些 与 缓存 网 页 片段 不 同 的 动态 内 容 分 发 方法 ， 它 们 是 在 代理 缓存 服务 器 上 
对 产生 网 页 的 手段 进行 缓存 。 之 所 以 采取 这 个 方法 ， 是 因为 按 需 产生 内 容 的 时 间 比 单 
纯 读 取 任 何 动态 内 容 所 用 的 时 间 长 ， 因 为 前 者 需要 多 次 查询 数据 库 。 所 以 ， 一 个 简单 
的 想法 就 是 在 CDN 代理 缓存 服务 器 上 缓存 应 用 代码 ， 并 且 保 持 数 据 中 心 化 。 这 个 技 
术 是 Akamai 和 ACDNC 中 边缘 计算 方法 的 基本 模块 。 这 种 方法 的 一 个 缺点 是 所 有 的 
用 户 请 求 都 必须 在 一 个 中 心 数 据 库 中 得 到 响应 ， 因 此 这 种 中 心 化 的 架构 会 导致 性 能 瓶 
颈 。 为 了 解决 这 个 问题 ， 一 种 方法 是 在 每 一 个 代理 缓存 服务 器 上 建立 一 个 数据 库 的 部 
分 副本 ， 实 现 该 方法 的 系统 被 称 为 内 容 已 知 缓存 (CAC) 系统 ; 另 一 种 方法 是 对 于 
应 用 代码 产生 的 数据 库 查询 结果 进行 缓存 ， 该 方法 被 称 为 内 容 未 知 缓存 (CBC) 7, 
每 当 收 到 一 个 查询 时 ， 就 会 检查 查询 的 结果 是 否 被 缓存 。Sivasubramanian 4& A" ij 
实验 结果 显示 ， 当 查询 负载 呈现 高 度 局 部 性 时 ，CBC 具有 很 好 的 性 能 ; 相反， 如 果 
查询 负载 呈现 较 低 的 局 部 性 ， 则 CAC 的 性 能 更 好 些 。 


14.7.3 移动 流 媒体 的 分 发 


随 着 下 一 代 移 动 系统 带宽 的 增加 ， 流 媒体 成 为 了 内 容 分 发 服务 中 的 重要 组 成 部 
分 。 所 以 ， 在 移动 环境 中 有 效 地 发 布 流 媒体 是 个 非常 有 挑战 的 课题 。 通 常 ， 流 媒体 内 
容 可 以 分 为 如 下 几 种 : 


© IBM WebSphere 应 用 服务 器 : http: //www - 306. ibm. com/software/webservers/appserv/ 
was/ o 原 书 注 
© http: //www. akamai. com。 一 -一 原 书 注 
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(1) 直播 内 容 

内 容 从 编码 器 立即 发 布 到 多 媒体 服务 器 ， 然 后 到 终端 用 户 。 

(2) 点 播 内 容 

内 容 在 编码 器 完成 编码 后 ， 先 以 流 媒 体 文 件 的 形式 存储 在 媒体 服务 器 上 ， 随 后 供 
终端 用 户 下 载 。 

媒体 服务 器 是 一 个 专用 的 、 运 行 在 通用 服务 器 上 的 一 个 软件 ， 负 责 响应 用 户 对 经 
编码 的 数字 化 内 容 的 请 求 。 当 用 户 对 某 个 特定 内 容 发 出 请 求 时 ， 媒 体 服 务 器 以 相应 的 
视频 或 音频 流 来 响应 。Roy 等 人 "讨论 了 这 种 服务 器 在 CDN 中 的 设计 要 求 。 但 是 ， 
由 于 流 媒体 的 严格 需求 、 无 线 网 络 的 局 限 性 和 用 户 的 移动 性 ， 向 大 量 移动 用 户 发 布 多 
媒体 内 容 时 会 产生 一 些 严 重 的 问题 。 

移动 CDN 可 以 通过 将 移动 用 户 的 大 量 流 媒体 需求 分 配 至 代理 缓存 服务 器 来 解决 
上 面 所 提 到 的 问题 。 甚 至 ，CDN 代理 缓存 服务 器 可 以 采用 最 新 的 压缩 技术 (缓存 、 
编码 等 ) 来 改善 流 媒体 的 发 布 。 具 体 地 说 ， 一 个 移动 流 媒体 CDN 应 该 考虑 以 下 问题 : 

(1) 代理 缓存 服务 器 的 选择 

当 用 户 请 求 某 个 目标 时 ， 他 /她 的 请 求 应 该 被 代理 缓存 服务 器 直接 响应 。 为 了 实 
Ji ExRE fn, Yoshimura 等 人 ”提出 了 一 个 移动 流 媒体 内 容 发 布 的 网 络 结构 ， 其 中 代 
理 缓存 服务 器 的 选择 是 由 一 个 SMIL 文件 决定 的 。 包 含有 代理 缓存 服务 器 状态 信息 的 
SMIL 文件 存储 在 流 媒体 服务 器 上 ， 移 动用 户 可 以 通过 读 SMIL 文件 来 选择 CDN 中 可 
以 对 其 提供 最 好 响应 的 代理 缓存 服务 器 。 

(2) 媒体 缓存 

早期 的 研究 表明 ， 将 缓存 技术 整合 到 CDN 中 可 以 提高 CDN 的 性 能 。 问 题 是 如 何 
决定 什么 样 的 媒体 流 应 该 被 缓存 在 代理 缓存 服务 器 的 磁盘 上 。 一 个 解决 办 法 是 存储 所 
有 的 多 媒体 流 ， 但 这 个 办 法 并 不 可 行 ， 因 为 多 媒体 流 需要 的 存储 空间 相当 大 。 所 以 ， 
应 该 在 移动 多 媒体 流 CDN 中 使 用 有 效 的 数据 管理 方法 ， 这 样 缓存 管理 器 就 可 以 借助 
这 些 方法 有 效 地 将 内 容 复制 到 每 个 代理 缓存 服务 器 。 一 个 简单 的 办 法 就 是 将 对 象 分 
段 ， 也 就 是 说 将 多 媒体 对 象 分 成 更 小 的 单元 去 缓存 ， 这 样 可 以 提高 存储 效率 和 网 络 利 
用 率 。 在 现 有 文献 中 有 一 些 方法 用 于 缓存 分 段 "] ， 如 前 级 缓存 ”或 变 尺寸 分 段 ” 都 
是 有 代表 性 的 缓存 分 段 技 术 。 

(3) 管理 会 话 的 切换 

在 流 媒 体 中 应 用 中 ， 用 户 会 话 具 有 持久 性 。 但 是 ， 在 移动 环境 中 这 种 持久 性 会 产 
生 一 个 问题 : 如 何以 有 效 的 方式 对 代理 缓存 服务 器 间 的 会 话 切换 (handoff) 进行 管 
理 。 在 切换 时 应 保证 没有 内 容 丢 失 ， 且 流 媒体 数据 对 于 视频 播放 器 仍 保 持 尽 可 能 的 流 
畅 。 在 参考 文献 [49] 中 ,使 用 SMIL 文件 用 来 控制 会 话 切换 。 

Apostolopoulos 等 人 "提出 了 一 个 移动 流 媒 体 CDN (MSM - CDN) 框架 ， 这 个 框架 


O ”同步 多 媒体 集成 语言 (Synchronized Multimedia Integration Language, SML) 是 一 个 W3C 推荐 的 XML 
标记 语言 ， 用 于 描述 多 媒体 的 特征 。SMIL 定义 了 对 于 时 间 、 布 局 、 动 画 、 可 视 化 过 渡 以 及 媒体 其 人 
等 的 标识 。 一 一 原 书 注 
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人 允许 在 下 一 代 移 动 网 络 中 进行 媒体 分 发 。 这 个 移动 流 媒 体 CDN 框架 采用 模块 化 设计 ， 
支持 与 其 他 系统 和 底层 网 络 之 间 的 操作 。 其 中 ， 用 来 缓存 媒体 流 的 覆盖 服务 器 是 移动 
流 媒 体 CDN 的 基本 组 成 部 分 〈 这 里 ， 一 个 覆盖 服务 器 可 被 视 为 代理 缓存 服务 器 ) o 
体 的 分 发 可 以 通过 流 接口 和 数据 传输 接口 进行 ， 在 移动 流 媒体 CDN 中 的 接口 方便 了 
媒体 流 至 移动 用 户 的 分 发 。 在 参考 文献 [49] 中 提出 了 另外 一 种 移动 流 媒 体 CDN fi 
架 ， 其 创新 之 处 在 于 让 所 有 与 CDN 有 关 的 技术 都 可 以 在 经 SMIL 修改 后 得 到 应 用 。 


14.8 结论 


移动 内 容 网 络 的 新 技术 (如 GSM/3G, Wi-Fi) 使 无 线 网 络 设施 可 以 支持 那 
些 带 宽 密集 型 服务 ， 如 流 媒体 、 移 动 电视 等 。 通 常 被 移动 用 户 请 求 的 那些 信息 ， 要 人 么 
是 动态 内 容 ， 要 么 是 媒体 应 用 。 考 虑 到 移动 用 户 对 信息 的 需求 越 来 越 大 ,我 们 迫切 需 
要 新 技术 的 诞生 ， 以 改善 信息 分 发 的 效率 。 但 是 ， 典 型 的 CDN 已 经 不 能 满足 移动 无 
线 网 络 中 的 这 些 需 求 ， 因 为 这 种 设施 存在 固有 的 局 限 性 ， 无 法 满足 移动 设备 的 需要 。 
也 就 是 说 没有 考虑 到 用 户 的 移动 性 。 针 对 这 种 状况 ， 移 动 CDN 可 以 通过 加 速 在 无 线 
网 络 设施 中 的 信息 发 布 来 解决 这 些 问题 。 移 动 CDN 与 典型 CDN 在 代理 缓存 服务 器 的 
拓扑 结构 、 内 容 外 包 策 略 和 应 用 服务 上 都 有 区 别 。 

本 章 概述 了 移动 CDN 在 移动 网 络 设施 的 最 新 发 展 过 程 中 所 扮演 的 角色 ， 同 时 讨 
论 了 如 何 通过 新 兴 的 移动 CDN 技术 来 改善 信息 分 发 ， 为 此 我 们 列 出 了 移动 CDN 的 主 
要 特点 。 随 后 ， 我 们 提出 了 在 移动 CDN 中 常见 的 动态 内 容 分 发 技术 、 内 容 放置 技术 
和 移动 流 媒体 技术 。 最 后 ， 我 们 讨论 了 移动 CDN 的 网 络 设施 ， 并 探讨 了 现 有 的 信息 
分 发 技术 。 

总 的 来 说 ， 移 动 无 线 环 境 下 的 信息 分 发 是 一 项 有 意义 、 有 挑战 的 研究 内 容 。 移 动 
CDN 的 出 现 ， 为 业界 和 学 术 界 开辟 了 新 的 视角 。 尽 管 在 某 些 方面 已 经 有 了 若干 进展 ， 
但 无 论 在 理论 上 还 是 在 实际 应 用 上 都 还 存在 着 很 大 的 发 展 空间 ， 在 移动 计算 和 移动 网 
络 技术 领域 内 需要 继续 进行 新 的 探索 。 


参考 文献 


[1] Aioffi, W.M., Mateus, G.R., Almeida, J.M., Loureiro, A.A.F.: Dynamic content distribution 
for mobile enterprise networks. IEEE Journal on Selected Areas on Communication 23(10) 
(2005) 

[2] Anda, J., LeBrum, J., Ghosal, D., Chuah, C.N., Zhang, M.: Vgrid: Vehicular ad-hoc network- 
ing and computing grid for intelligent traffic control. In: Vehicular Technology Conference, 
2005. VTC 2005-Spring. 2005 IEEE 61st, Vol. 5, pp. 2905-2909 (2005) 

[3] Apostolopoulos, J.G., Wee, S., tian Tan, W.: Performance of a multiple description streaming 
media content delivery network. In: Proceedings of the 2002 International Conference on 
Image Processing (ICIP 2002), pp. 189-192. Rochester, New York, USA (2002) 

[4] Chae, M., Kim, J.: What's so different about the mobile internet? Commun. ACM 46(12), 
240—247 (2003) 

[5] Challenger, J., Dantzig, P., Iyengar, A., Witting, K.: A fragment-based approach for efficiently 
creating dynamic web content. ACM Trans. Inter. Tech. 5(2), 359-389 (2005) 


第 14 章 移动 CDN 中 的 信息 发 布 





[6] Chand, N., Joshi, R.C., Misra, M.: Cooperative caching in mobile ad hoc networks based on 
data utility. Mobile Information Systems 3(1), 19-37 (2007) 

[7] Chen, S., Wang, H., Zhang, X., Shen, B., Wee, S.: Segment-based proxy caching for internet 
streaming media delivery. IEEE MultiMedia 12(3), 59-67 (2005) 

[8] Chen, Y., Katz, R.H., Kubiatowicz, J.: Dynamic replica placement for scalable content de- 
livery. In: Proceedings of the 1st International Workshop on Peer-to-Peer Systems (IPTPS), 
pp. 306-318. Cambridge, USA (2002) 

[9] Chen, Y., Qiu, L., Chen, W., Nguyen, L., Katz, R.: Efficient and adaptive web replication 
using content clustering. IEEE Journal on Selected Areas in Communications 21(6), 979—994 
(2003) 

[10] Chisalita, I., Shahmehri, N.: A peer-to-peer approach to vehicular communication for the sup- 
port of traffic safety applications. In: Proceedings of IEEE 5th International Conference on 
Intelligent Transportation Systems, pp. 336-341 (2002) 

[11] Daly, E.M., Haahr, M.: Social network analysis for routing in disconnected delay-tolerant 
manets. In: Proceedings of the 8th ACM international symposium on Mobile ad hoc network- 
ing and computing, pp. 32-40 (2007) 

[12] Dikaiakos, M.D.: Intermediary infrastructures for the world wide web. Computer Networks 
45(4), 421—447 (2004) 

[13] Dikaiakos, M.D., Florides, A., Nadeem, T., Iftode, L.: Location-aware services over vehic- 
ular ad-hoc networks using car-to-car communication. IEEE Journal on Selected Areas in 
Communications 25(8) (2007) 

[14] Dilley, J., Maggs, B.M., Parikh, J., Prokop, H., Sitaraman, R.K., Weihl, W.E.: Globally dis- 
tributed content delivery. IEEE Internet Computing 6(5), 50-58 (2002) 

[15] Dow, C.R., Lin, P.J., Chen, S.C., Lin, J.H., Hwang, S.F.: A study of recent research trends and 
experimental guidelines in mobile ad hoc networks. In: AINA '05: Proceedings of the 19th 
International Conference on Advanced Information Networking and Applications, pp. 72-77 
(2005) 

[16] Günes, M., Siekermann, J.: Cosmos - communication scenario and mobility scenario generator 
for mobile ad-hoc networks. In: Proceedings of the 2nd Int. Workshop on MANETS and 
Interoperability Issues (MANETII’05) (2005) 

[17] Hara, T.: Replica allocation methods in ad-hoc networks with data update. Mobile Networks 
and Applications (MONET) 8(4), 343-354 (2003) 

[18] Housel, B.C., Samaras, G., Lindquist, D.B.: Webexpress: a client/intercept based system for 
optimizing web browsing in a wireless environment. Mobile Networking and Applications 
3(4), 419—431 (1998) 

[19] Kangasharju, J., Roberts, J.W., Ross, K.W.: Object replication strategies in content distribution 
networks. Computer Communications 25(4), 376—383 (2002) 

[20] Krajzewicz, D., Hertkorn, G., Rossel, C., Wagner, P.: Sumo (simulation of urban mo- 
bility); an open-source traffic simulation. In: 4th Middle East Symposium on Simula- 
tion and Modelling (MESM2002), pp. 183-187. SCS European Publishing House (2002). 
Http://sumo.sourceforge.net (last accessed January 2007) 

[21] Mahdy, A.M., Deogun, J.S., Wang, J.: Mobile ad hoc networks: a hybrid approach for the 
selection of super peers. In: Proceedings of the 2nd IFIP International Conference on Wireless 
and Optical Communications Networks (WOCN 2005), pp. 280-284 (2005) 

[22] Mateus, G.R., Goussevskaia, O., Loureiro, A.A.F.: Simulating demand-driven server and ser- 
vice location in third generation mobile networks. In: Proceedings of the 9th International 
Euro-Par Conference, pp. 1118-1128. Klagenfurt, Austria (2003) 

[23] Miranda, H., Leggio, S., Rodrigues, L., Raatikainen, K.E.E.: An algorithm for dissemination 
and retrieval of information in wireless ad-hoc networks. In: Proceedings of the 13th Interna- 
tional Euro-Par Conference, pp. 891—900. Rennes, France (2007) 

[24] Morris, R., Jannotti, J., Kaashoek, F., Li, J., Couto, D.D.: Carnet: A scalable ad hoc wireless 
network system. In: Proceedings of the 9th ACM SIGOPS European workshop: Beyond the 
PC: New Challenges for the Operating System, pp. 61-65. Kolding, Denmark (2000) 

[25] N. Bartolini, F.L.P., Petrioli, C.: Optimal dynamic replica placement in content delivery net- 
works. In: 11th IEEE International Conference on Networks (ICON 2003), pp. 125-130. 


Sydney, Australia (2003) 


293 


294 内 容 分 发 网 络 





[26] Nadeem, T., Dashtinezhad, S., Liao, C., Iftode, L.: Trafficview: traffic data dissemination using 
car-to-car communication. SIGMOBILE Mob. Comput. Commun. Rev. 8(3), 6-19 (2004) 

[27] Pallis, G., Vakali, A.: Insight and perspectives for content delivery networks. Commun. ACM 
49(1), 101—106 (2006) 

[28] Pallis, G., Vakali, A., Stamos, K., Sidiropoulos, A., Katsaros, D., Manolopoulos, Y.: A latency- 
based object placement approach in content distribution networks. In: Third Latin American 
Web Congress (LA-Web 2005), pp. 140-147. Buenos Aires, Argentina (2005) 

[29] Pathan, A.M.K., Buyya, R.: A taxonomy and survey of content delivery networks. Technical 
Report, GRIDS-TR-2007-4, Grid Computing and Distributed Systems Laboratory, The Uni- 
versity of Melbourne (2007) 

[30] Pitoura, E., Chrysanthis, P.K.: Caching and replication in mobile data management. IEEE 
Data Eng. Bull. 30(3), 13-20 (2007) 

[31] Presti, F.L., Petrioli, C., Vicari, C.: Dynamic replica placement in content delivery networks. 
In: Proceedings of the 13th International Symposium on Modeling, Analysis, and Simulation 
of Computer and Telecommunication Systems (MASCOTS 2005), pp. 357-360. Atlanta, GA, 
USA (2005) 

[32] Rabinovich, M., Spatscheck, O.: Web Caching and Replication. Addison Wesley (2002) 

[33] Rabinovich, M., Xiao, Z., Douglis, F., Kalmanek, C.R.: Moving edge-side includes to the real 
edge - the clients. In: Proceedings of the USENIX Symposium on Internet Technologies and 
Systems, pp. 12-26. Seattle, Washington, USA (2003) 

[34] Ramaswamy, L., Iyengar, A., Liu, L., Douglis, F.: Automatic fragment detection in dynamic 
web pages and its impact on caching. IEEE Trans. Knowl. Data Eng. 17(6), 859-874 (2005) 

[35] Rilling, L., Sivasubramanian, S., Pierre, G.: High availability and scalability support for web 
applications. In: SAINT '07: Proceedings of the 2007 International Symposium on Applica- 
tions and the Internet. IEEE Computer Society, Washington, DC, USA (2007) 

[36] Roy, S., Ankcorn, J., Wee, S.: Architecture of a modular streaming media server for con- 
tent delivery networks. In: Proceedings of the 2003 International Conference on Multimedia 
and Expo (ICME ’03), Vol. 3, pp. 569-572. IEEE Computer Society, Washington, DC, USA 
(2003) 

[37] Royer, E., Toh, C.: A review of current routing protocols for ad-hoc mobile wireless networks. 
Personal Communications, IEEE 6(2), 46—55 (1999) 

[38] Sailhan, F., Issarny, V.: Energy-aware web caching for mobile terminals. In: Proceedings of 
the 22nd International Conference on Distributed Computing Systems, pp. 820-825. IEEE 
Computer Society (2002) 

[39] Sen, S., Rexford, J., Towsley, D.F.: Proxy prefix caching for multimedia streams. In: Proceed- 
ings of the IEEE INFOCOM, pp. 1310-1319. New York, USA (1999) 

[40] Sidiropoulos, A., Pallis, G., Katsaros, D., Stamos, K., Vakali, A., Manolopoulos, Y.: Prefetch- 
ing in content distribution networks via web communities identification and outsourcing. 
World Wide Web 11(1), 39-70 (2008) 

[41] Sivasubramanian, S., Pierre, G., van Steen, M., Alonso, G.: Analysis of caching and replication 
strategies for web applications. IEEE Internet Computing 11(1), 60—66 (2007) 

[42] T Nadeem, P.S., Iftode., L.: A comparative study of data dissemination models for vanets. 
Proceedings of the 3rd Annual International Conference on Mobile and Ubiquitous Systems 
(MOBIQUITOUS) (2006) 

[43] Teng, W.G., Chang, C.Y., Chen, M.S.: Integrating web caching and web prefetching in client- 
side proxies. IEEE Trans. Parallel Distrib. Syst. 16(5), 444—455 (2005) 

[44] Tse, S.S.H.: Approximate algorithms for document placement in distributed web servers. 
IEEE Trans. Parallel Distrib. Syst. 16(6), 489—496 (2005) 

[45] Vakali, A., Pallis, G.: Content delivery networks: status and trends. IEEE Internet Computing 
7(6), 68—74 (2003) 

[46] Wu, T., Dixit, S.: The content driven mobile internet. Wireless Personal Communications: An 
International Journal 26(2—3), 135-147 (2003) 

[47] Xu, Z., Guo, X., Wang, Z., Pang, Y.: The dynamic cache algorithm of proxy for streaming 
media. In: Proceedings of the International Conference on Intelligent Computing (ICIC 2005), 
pp. 1065-1074. Hefei, China (2005) 

[48] Yin, L., Cao, G.: Supporting cooperative caching in ad-hoc networks. IEEE Trans. Mob. 


$143 移动 CDN 中 的 信息 发 布 





Comput. 5(1), 77-89 (2006) 

[49] Yoshimura, T., Yonemoto, Y., Ohya, T., Etoh, M., Wee, S.: Mobile streaming media cdn en- 
abled by dynamic smil. In: Proceedings of the 1 1th International World Wide Web Conference, 
WWW2002, pp. 651-661. Honolulu, Hawaii, USA (2002) 

[50] Zemlianov, A., de Veciana, G.: Capacity of ad hoc wireless networks with infrastructure sup- 
port. IEEE Journal on Selected Areas in Communications 23(3), 657—667 (2805) 

[51] Zhuo, L., Wang, C.L., Lau, F.C.M.: Load balancing in distributed web server systems with 
partial document replication. In: Proceedings of the 31st International Conference on Parallel 
Processing (ICPP), p. 305. Vancouver, Canada (2002) 


295 


第 15 章 社区 网 络 的 基础 设施 


Thomas Plagemann, Roberto Canonico, Jordi Domingo-Pascual , 


Carmen Guerrero 和 Andreas Mauthe 
15.1 引言 


内 容 分 发 技术 在 最 近 的 几 年 时 间 内 经 历 了 诸多 变革 。 仅 仅 十 年 前 ， 内 容 分 发 的 主 
要 渠道 还 只 是 通过 电视 和 广播 ， 而 如 今 内 容 却 可 以 通过 互联 网 或 其 他 的 电子 传输 渠道 
以 数字 形式 进行 发 布 。 现 在 ， 通 过 互联 网 分 发 多 媒体 内 容 已 经 得 到 了 业界 的 高 度 重 
视 。 尽 管 如 此 ， 在 社区 范围 内 要 想 在 不 同 种 类 的 移动 终端 之 间 进 行内 容 分 发 ， 仍 然 存 
在 着 诸多 仍 未 解决 的 实际 问题 。 早 期 的 基于 互联 网 的 内 容 分 发 系统 一 般 被 设计 成 集中 
式 系统 ， 其 中 内 容 是 通过 中 央 服 务 器 提供 给 庞大 的 终端 用 户 群 CLE 15.1a) 。 现 在 
这 种 趋势 正 慢 慢 转 向 分 布 式 系统 (如 PAP 系统 ) ， 内 容 提供 商 也 已 经 不 再 仅仅 局 限 在 
少数 专业 化 的 内 容 创 作者 。 因 此 ， 内 容 分 发 的 路 径 不 再 仅仅 是 直接 从 服务 器 通过 主干 
网 到 达 终 端 用 户 ， 也 可 以 是 从 一 个 终端 用 户 直接 到 达 另 一 个 终端 用 户 〈 见 图 15. 1b)。 
这 种 趋势 随 着 技术 的 发 展 和 一 些 相 对 廉价 的 电子 消费 产品 的 产生 而 更 加 明显 ， 使 得 人 
人 都 可 以 成 为 内 容 的 提供 者 。 不 仅 如 此 ， 高 速 网 络 的 接 人 率 (如 xDSL 网 络 ) 和 P2P 
技术 的 普及 率 变 得 越 来 越 高 ， 使 得 计算 机 用 户 也 变 成 了 内 容 提 供 商 。 








图 15.1 内容 分 发 路 径 
a) 传统 b) 当前 P2P c) 未 来 连接 到 家 庭 的 社区 网 络 (基于 参考 文献 [44] ) 


欧洲 的 “卓越 网 络 ” (European Network - of - Excellence CONTENT) /5? 在 许多 方 
面 对 这 个 领域 的 发 展 进行 了 深入 研究 ， 他 们 将 重点 放 在 内 容 分 发 在 社区 网 络 中 所 面临 
的 挑战 上 面 。 在 社区 网 络 中 ， 端 用 户 不 仅 “ 消 费 内 容 ”， 而 且 还 可 以 制作 内 容 ， 同 时 
为 网 络 基础 设施 提供 核心 组 件 ， 即 社区 网 络 。 这 样 看 来 ， 在 社区 网 络 内 部 ， 内 容 分 发 
的 路 径 也 许 不 一 定 要 使 用 由 互联 网 服务 提供 商 提供 的 任何 基础 设施 〈 见 图 15. le) 。 

虽然 “社区 网 络 ” 这 一 术语 非常 直观 易 懂 ， 但 其 具体 含义 仍然 值得 我 们 深入 研 
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究 ，Rosson 等 人 ' 给 出 的 定义 如 下 : 

“一 个 网 络 社区 是 指 一 群 人 通过 网 络 通信 和 和 协作， 加 强 和 促进 他 们 认识 和 目标 的 
共同 分 享 。 网 络 社区 的 出 现 是 底层 技术 发 展 的 一 个 突出 例子 。 在 一 个 网 络 社区 中 ， 社 
区 网 络 是 物理 社区 与 网 络 社区 共同 发 展 的 一 种 特殊 的 情况 。” 

根据 这 一 定义 ， 社 区 不 仅 是 人 们 通过 网 络 协作 形成 的 ， 同 时 也 是 人 们 通过 贡献 自 
己 的 资源 (如 个 人 和 其 邻里 之 间 的 网 络 ) 形成 的 。 社 区 成 员 可 以 由 几 种 无 线 网 络 技 
术 提 供 接 和 人 网， 他 们 也 是 主要 通过 这 种 方式 由 一 个 或 者 几 个 互联 网 服务 提供 商 来 连接 
网 络 。 在 社区 网 络 中 ， 相 当 一 部 分 内 容 发 布 可 以 在 没有 任何 ISP 的 参与 下 完成 ， 也 就 
是 说 ， 仅 仅 在 物理 的 社区 网 络 内 部 就 可 以 完成 。 但 是 没有 任何 证 据 表 明 ， 相 比 传统 的 
内 容 分 发 网 (CDN) 和 了 P2P 用 户 , 社区 网 络 会 对 互联 网 构成 更 大 的 威胁 。 

关于 内 容 分 发 ， 最 重要 的 概念 就 是 在 社区 网 络 中 “底层 技术 发 展 ” 是 由 “人 ” 
来 推动 的 ， 这 里 所 说 的 “人 ”也 就 是 普通 的 终端 用 户 ， 他 们 可 能 并 没有 受过 特殊 教 
育 ， 也 没有 在 计算 机 和 网 络 管理 、 软 件 开发 等 方面 的 独特 技能 。 因 此 ， 内 容 分 发 的 离 
散 化 就 必须 与 在 所 有 技术 层面 上 的 自 配 置 、 自 组 织 、 自 管理 和 自 适 应 的 解决 方案 相 结 
合 ， 只 有 这 样 才 能 真正 地 达到 尽量 减少 内 容 分 发 过 程 中 人 工 干 预 的 目的 。 

此 外 ，Cowan 等 人 "在 1998 年 指明 ， 内 容 服务 发 挥 着 核心 作用 : 

“实际 上 ， 社 区 是 那些 需要 被 搜寻 、 阅 读 、 探 索 、 行 动 和 更 新 的 大 量 异 构 信 息 的 
数据 仓库 ， 并 且 为 合作 和 双向 交流 等 其 他 形式 提供 了 机 会 。” 

在 1998 年 ， 多 媒体 内 容 还 并 不 是 这 种 观点 的 核心 。 然 而 ， 随 着 消费 类 电子 产品 
和 信息 通信 技术 的 发 展 ， 我 们 认为 正 是 这 两 者 使 得 多 媒体 内 容 的 应 用 成 为 可 能 ， 并 且 
由 此 产生 了 社区 网 络 中 对 各 种 内 容 服务 的 强烈 需求 。 社 区 成 员 不 仅 需 要 消费 内 容 ， 而 
且 还 要 同 其 他 人 分 享 ， 并 要 寻找 特定 的 内 容 ， 将 不 同 的 内 容 进行 组 合 ， 甚 至 自己 动手 
编辑 复杂 的 多 媒体 对 象 。 

因此 ， 内 容 的 分 发 和 使 用 在 社区 网 络 方面 显得 十 分 特殊 。 这 主要 有 两 个 原因 : 首 
先 ， 在 物理 社区 网 络 中 需要 自治 网 络 和 覆盖 网 解决 方案 来 建立 和 维护 适当 的 内 容 分 发 
网 络 ; 其 次 ， 人 们 对 复杂 及 任意 类 型 的 内 容 服 务 (如 内 容 的 改编 、 转 换 、 索 引 、 存 
储 等 ) 的 需求 ， 远 远 超过 了 对 内 容 的 简单 传输 和 消费 。 

为 了 描述 社区 网 络 的 现状 及 其 面临 的 短期 和 长 期 的 研究 挑战 ， 本 章 在 结构 上 做 了 
如 下 安排 接 下 来 的 部 分 给 出 了 社区 网 络 的 背景 信息 ， 包 括 一 个 简单 的 框架 和 相关 的 
工作 ， 随 后 描述 了 社区 网 络 在 产业 领域 面临 的 难题 以 及 长 期 的 研究 挑战 。 本 章 的 结尾 
部 分 总 结 了 社区 网 络 中 内 容 分 发 和 内 容 服务 的 若干 最 重要 的 方面 。 


15.2 ”背景 和 相关 工作 


在 过 去 几 年 中 一 个 有 趣 的 现象 是 出 现 了 大 量 的 无 线 社区 网 络 (WCN) ， 它 们 向 城 
市 中 的 社区 成 员 提供 互联 网 接 入 。 这 些 网 络 有 些 可 能 是 人 们 自发 地 通过 自己 的 各 种 形 
式 的 家 用 数字 用 户 线路 (xDSL) 建立 的 ， 另 一 部 分 可 能 是 由 当地 机 构建 立 的 。 例 如 ， 
当地 议会 和 大 学 已 经 开始 在 有 限 区 域内 〈 如 社区 、 校 园 、 商 业 场所 ) 或 者 公共 建筑 
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内 向 用 户 群 (如 学 生 ) 提供 无 线 互 联网 接 入 服务 。 一 个 “机 构 的 ”无 线 社区 网 络 的 
例子 就 是 阿 莫 斯 特 镇 (Amherst) 向 它 的 居民 提供 无 线 网 状 网 (Wireless Mesh 
Networks ) [4 

最 热门 的 “自发 ”WCN 由 所 谓 的 “FON 社区 ”创建 的 。FON 成 员 (Bp Foner- 
os) 会 共享 他 们 的 一 些 xDSL 互联 网 连接 ， 并 由 此 免费 接 人 社区 的 FON 全 球 网 点 。 当 
然 会 有 某 些 用 户 并 不 希望 与 社区 中 的 其 他 人 共享 连接 ， 针 对 这 种 情况 ，FON 社区 也 
创建 了 一 个 需要 付费 的 互联 网 连接 业务 。FON 类 似 一 种 独特 商业 模式 的 Wi - Fi 服务 
提供 商 。 欧 洲 的 一 些 商 业 互 联网 服务 提供 商 已 经 开始 关注 涉及 分 享 家 庭 互联 网 接 
入 "的 法 律 问题 。 在 不 久 的 将 来 ， 内 容 服 务 可 能 会 被 提供 给 社区 并 由 此 增加 它 的 商 
业 价 值 。 这 样 一 种 为 社区 提供 服务 的 想法 已 经 得 到 一 个 意大利 社区 Ninux. org!” 的 支 
持 ， 该 社区 为 其 成 员 提供 动态 DNS 服务 和 基于 会 话 启 动 协议 (SIP) 的 专用 交换 机 
(PBX) 服务 。 

有 趣 的 是 ， 自 发 社区 网 络 模型 即使 在 一 些 不 发 达 国 家 也 已 经 被 证 明 是 成 功 的 ， 尤 
其 在 为 乡村 地 区 提供 互联 网 连接 方面 。 自 从 印度 解除 了 禁止 在 室外 使 用 无 线 局 域 网 的 
规定 后 ， 在 2005 年 2 A, Dharamsala 无 线 mesh 网 社区 网 络 就 逐渐 活跃 起 来 。 目 前 ， 
该 网 络 为 数 千 用 户 提供 宽带 互联 网 服务 。 除 了 互联 网 接 人 ， 社 区 成 员 还 可 以 通过 这 个 
网 络 实现 文件 共享 、 异 地 备份 、 远 程 高 质量 的 影音 播放 和 大 量 的 网 络 电话 (VoIP) 
服务 。 

为 了 应 对 当今 和 未 来 在 社区 网 络 中 内 容 发 布 和 使 用 的 挑战 ， 仅 靠 各 个 子 系统 
(如 内 容 分 发 网 ) 是 远 远 不 够 的 。 相 反 ， 包 括 基 于 IP 的 网 络 、 内 容 分 发 网 络 、 内 容 服 
务 以 及 终端 用 户 的 整个 系统 都 必须 被 包含 进来 。 


15.2.1 架构 性 框架 


在 图 15.2 中 描述 的 框架 中 ， 由 于 社区 网 络 提供 了 基本 连接 ， 因 此 期 望 它们 未 来 
能 够 在 框架 中 发 挥 核心 的 作用 。 在 这 种 情况 下 ， 实 际 的 社区 网 络 就 应 该 是 由 家 庭 环 
境 、 邻 里 之 间 设备 构成 的 所 有 网 络 的 集合 体 ， 并 且 它 们 的 组 合 构成 了 多 跳 和 网 状 网 
络 。 社 区 网 络 和 社交 网 络 类 似 ， 它 的 主要 目的 是 支持 本 地 社区 。 由 于 多 媒体 内 容 通 常 
会 分 布 在 这 样 的 网 络 中 ， 因 此 就 出 现 了 一 系列 胃 新 的 、 吸 引 人 的 研究 内 容 ， 如 移动 
性 、 漫 游 、 资 源 分 配 、 用 户 需 求 /感知 的 体 






验 质量 (QE) 和 服务 质量 (QoS)、 拓 扑 鲁 /x 








通常 ， 覆 盖 网 解决 方案 被 用 于 实现 
CDN， 这 是 在 我 们 架构 性 框架 中 分 发 设施 这 
一 层 体现 出 来 的 。 这 些 解决 方案 中 也 包括 越 分 发 设施 
来 越 多 的 终端 用 户 ， 例 如 为 网 络 提供 某 种 资 
源 和 服务 的 对 等 点 和 和 覆盖 节点 。 覆 盖 网 提供 
了 一 种 抽象 结构 ， 用 于 隐藏 底层 物理 网 络 中 图 15.2 高 级 架构 性 框架 
的 烦琐 细节 ， 例 如 构成 社区 网 络 的 一 个 无 线 mesh 网 。 然 而 覆盖 网 也 必须 意识 到 底层 
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社区 网 络 的 基本 属性 ， 这 样 才能 实现 各 种 服务 的 非 功能 性 需求 ， 如 应 变 能 力 和 工作 性 
能 。 履 盖 网 的 典型 功能 是 缓存 和 请 求 路 由 ， 它 们 可 以 通过 代理 缓存 网 络 或 直接 连接 对 等 
节点 的 分 布 式 哈 希 表 来 完成 。 

内 容 服务 网 络 处 于 分 发 设施 的 顶层 ， 它 是 由 处 理 多 媒体 内 容 的 一 组 服务 构成 的 。 这 
些 服务 应 该 支持 音频 、 视 频 内 容 的 整个 生命 周期 ， 并 且 能 够 通过 组 合 几 个 简单 服务 来 提 
供 更 复杂 的 服务 。 内 容 服 务 的 典型 例子 包括 以 下 几 方面 : 内 容 分 类 和 内 容 抽 象 的 自动 分 
析 和 索引 服务 、 格 式 变换 的 转 码 服务 以 及 为 内 容 搜索 提供 深层 支持 的 搜索 服务 等 。 

最 后 ， 在 构建 框架 顶部 的 是 体验 质量 层 ， 它 能 反映 终端 用 户 的 实际 体验 。 在 一 般 
情况 下， 服务 质量 是 由 一 系列 的 技术 参数 定义 的 ， 这 些 技术 参数 主要 捕获 定量 方面 的 
内 容 ， 如 吞吐 量 、 出 错 率 、 延 时 、 拌 动 、 每 秒 传输 帧 数 (frame/s) 和 每 个 像素 的 比 
特 数 。 然 而 这 些 参 数 却 并 不 能 真实 地 反映 用 户 的 体验 ， 因 为 用 户 体验 并 不 仅仅 依靠 技 
术 参 数 来 衡量 ， 同 时 还 要 依靠 失败 和 错误 在 实际 直觉 上 的 感受 。 尽 管 体验 质量 是 服务 
质量 在 网 络 、 系 统 和 应 用 层 上 不 同 参数 的 函数 ， 但 是 服务 质量 参数 和 体验 质量 之 间 并 
不 存在 直接 的 变换 关系 。 因 此 ， 需 要 确认 哪 一 种 恶化 能 够 给 用 户 体验 带 来 最 大 的 负面 
影响 。 

在 社区 网 络 中 会 有 一 些 关于 内 容 发 布 方面 的 跨 层 问题 ， 这 些 问 题 横 跨 构 建 框架 的 
这 四 个 基本 层次 。 这 些 跨 层 问题 中 有 一 类 重要 问题 是 关于 不 同 层次 上 的 服务 质量 参数 
以 及 参数 之 间 如 何 相 互 关 联 。 另 一 类 跨 层 问题 是 关于 不 同 层 的 功能 可 能 会 导致 的 相互 
影响 ,在 自 适 应 解决 方案 中 ， 它 有 可 能 导致 连锁 反应 或 者 系统 行为 不 稳定 。 


15.2.2 社区 网 络 


社区 网 络 通常 并 不 是 网 络 服务 提供 商 拥有 的 网 络 设施 ， 相 反 它 是 由 私人 用 户 或 者 
由 分 散在 相对 较 小 的 地 理 范围 内 共享 资源 的 一 组 用 户 (如 邻里 之 间 ) 拥有 的 。 提 供 
社区 网 络 的 连接 是 一 项 富有 挑战 性 的 任务 ， 因 为 在 节点 中 需要 使 用 相当 多 的 接 人 技 
术 ， 并 且 还 要 求 节点 能 有 一 定 的 移动 性 。 

目前 可 能 被 用 于 社区 网 络 设施 的 技术 主要 包括 : 连接 到 互联 网 服务 提供 商 的 固定 
节点 所 涉及 的 xDSL、 输 电线 路 、 光 纤 (FITH); 无 线 接 人 网 络 服务 供应 商 的 节点 所 
涉及 的 无 线 城 域 网 ( WiMAX) 、 移 动 宽 带 无 线 接 人 ( MBWA) 、3G/ 通 用 移动 电话 服 
务 (UMTS) /高 速 下 行 分 组 服务 (HSDPA) ;移动 节点 和 家 庭 网 络 所 涉及 的 Wi - Fi 
和 蓝牙 技术 。 由 于 涉及 如 此 多 的 网 络 技术 ， 社 区 网 络 包含 的 节点 可 能 不 仅仅 是 用 户 终 
端 ， 还 可 以 是 路 由 器 、 中 继 设备 或 网 关 。 举 例 来 说 ， 固 定 节点 可 能 是 热点 (hotspot) 
或 同时 访问 点 〈 即 穿梭 于 社区 网 范围 内 的 节点 ) ， 同 时 也 可 能 表现 为 一 个 移动 网 关 、 
路 由 器 或 终端 。 

在 社区 网 络 的 概念 下 ， 对 多 种 网 络 技术 进行 了 集成 ， 如 移动 IPv4 和 IPv6、 多 宿 
( multihoming,) , 、 网 络 移动 性 (NEMO), #3) Ad - Hoc 网 络 ( MANET) 、 无 线 mesh 
网 (WMN) ， 以 及 无 线 传 感 器 网 络 (WSN) 和 无 线 多 媒体 传感器 网 络 (WMSN) 等 。 
通常 ， 不 同 网 络 技术 的 相互 协作 并 不 是 预先 定义 好 或 由 运营 者 负责 的 ， 因 此 自治 网 络 
所 具有 的 自我 配置 能 力 是 社区 网 络 必须 具备 的 。 总 而 言 之 ， 社 区 网 络 利用 了 各 种 各 样 
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的 网 络 技术 ， 而 这 些 技术 造就 了 一 个 富有 挑战 性 的 研究 环境 。 

社区 网 络 方案 中 涉及 的 技术 对 接 给 网 络 带 来 了 额外 的 复杂 性 ， 因 为 除了 同 种 技术 
需要 实现 对 接 〈 即 横向 对 接 ) ， 还 需要 支持 不 同 网 络 技术 之 间 的 对 接 〈 即 纵向 对 接 ) 。 
为 了 高 效率 地 管理 这 种 异 构 环 境 ， 美 国电 气 电子 工程 师 协会 (IEEE) 目前 正在 制定 
IEEE 802.21 标准 ， 旨 在 使 不 同 网 络 类 型 之 间 的 对 接 和 互 用 成 为 可 能 ， 其 中 就 包括 
802 和 非 802 网 络 。802. 21 标准 定义 了 一 个 抽象 层 ， 提 供 媒 介 独 立 对 接 (MIH) W 
能 ， 实 现 对 接 的 简化 以 及 对 不 同 的 接 人 技术 的 管理 。 

由 于 多 媒体 内 容 的 分 发 中 包括 实时 分 发 ， 因 此 服务 质量 成 为 社区 网 络 的 一 个 关键 
问题 。 服 务 质量 的 配置 在 有 线 网 络 中 仍然 是 一 个 尚未 解决 的 问题 ， 而 在 无 线 环 境 下 它 
会 更 加 复杂 。 对 于 这 一 点 ,在 IEEE 802.11 的 扩展 版 本 中 提供 可 靠 的 服务 质量 管理 是 
无 线 多 媒体 发 展 的 关键 。 并 且 ， 服 务 质 量 在 MANET Al WMN 中 的 作用 也 对 社区 网 络 
中 内 容 分 发 具有 重要 意义 。 


15.2.3 分 发 设施 


在 本 章 中 所 提 及 的 分 发 设施 是 指 建立 在 社区 网 络 顶 层 的 逻辑 设施 ， 其 具体 目的 是 
使 对 内 容 服 务 的 接 人 成 为 可 能 。 目 前 ， 大 多 数 发 布设 施 的 主要 目的 在 于 给 社区 成 员 提 
供 高 效 的 内 容 分 发 。 为 了 克服 传统 的 客户 端 /服务 器 模式 的 局 限 性 ，P2P 组 网 模式 正 
在 变 得 越 来 越 普及 。P2P 结构 通常 用 于 实现 某 种 形式 的 覆盖 网 ， 目 的 是 用 来 配置 那些 
不 能 直接 从 人 底层 网 络 的 服务 ， 如 组 播 路 由 对 象 的 定位 和 事件 传播 。 

请 求 路 由 和 实际 内 容 分 发 是 通过 覆盖 方式 实现 配套 服务 的 典型 的 例子 。 这 些 服 
务 的 实施 可 以 通过 与 终端 系统 的 单独 协作 来 实现 ， 也 可 以 是 通过 专用 代理 服务 器 
的 支持 来 实现 。 

社区 网 络 内 容 分 发 研究 的 一 个 共同 的 主题 是 “自治 性 ” (autonomicity ) 。 社 区 网 
络 主要 基于 个 人 合作 来 给 社区 网 络 提供 资源 。 因 此 ，P2P 技术 的 重要 性 在 于 ， 它 不 仅 
在 下 载 和 流 媒 体内 容 的 存储 方面 发 挥 着 重要 作用 ， 而 且 在 实时 流 媒 体 和 资源 共享 等 其 
他 方面 也 发 挥 着 重要 作用 。 

在 那些 被 广泛 部 署 的 基于 P2P 的 内 容 分 发 网 络 中 ， 有 三 个 关键 性 组 件 : P2P 覆盖 
网 络 、 特 定 的 内 容 分 发 策略 和 缓存 策略 。 履 盖 网 络 负责 连接 参与 其 中 的 对 等 成 员 、 管 
理 对 等 成 员 的 加 入 和 离开 、 进 行路 由 查询 以 及 管理 其 他 信息 ; 内 容 分 发 策略 负责 从 信 
息 源 向 目的 地 发 送 所 需 的 内 容 ; 缓存 策略 增加 P2P 系统 中 内 容 的 可 用 性 和 有 效 性 。 

非 集中 式 架构 的 巨大 的 潜力 和 优势 在 Napster 上 已 经 明显 表现 出 来 9。 从 那 时 起 ， 
大 量 的 研究 工作 集中 在 设计 自 组 织 、 可 扩展 、 强 大 和 高 效 的 覆盖 网 络 。 然 而 需要 特别 
指出 的 是 ,一 个 PP 覆盖 网 络 的 性 能 取决 于 多 种 因素 ,包括 应 用 、 网 络 节 点 的 资源 
和 用 户 行为 ， 而 这 些 因素 在 集中 式 系统 中 相关 性 较 小 。 例 如 ， 一 个 特定 的 覆盖 设计 在 


O Napster 是 早期 一 款 可 以 在 网 络 中 下 载 自己 想 要 的 MP3 文件 的 软件 ， 它 同时 能 够 让 用 户 自身 成 为 一 
台 服 务 器 ， 为 其 他 用 户 提 供 下 载 。 一 一 译 者 注 
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用 户 变动 率 较 低 的 情况 下 表现 得 很 好 ， 但 在 用 户 变动 很 大 时 它 的 实施 能 力 可 能 就 会 降 
低 到 平均 水 平 以 下 。 此 外 ， 内 容 分 发 系统 对 覆盖 网 络 也 有 一 定 的 要 求 ， 如 寻找 正在 分 
享 所 需 文 件 的 用 户 、 激 励 机 制 及 以 低 成 本 实现 高 效 对 等 通信 等 。 因 此 ， 目 前 有 很 多 研 
究 项 目 和 研究 计划 将 关注 点 集中 在 内 容 分 发 系统 中 P2P 覆盖 网 络 与 网 络 策略 之 间 直 
接 或 间接 的 影响 和 依赖 关系 。 

内 容 分 发 策略 的 很 多 方面 都 必须 考虑 到 策略 之 间 可 能 存在 的 相互 依存 关系 ， 它 们 
对 内 容 分 发 系统 的 整体 效率 和 性 能 的 影响 是 至 关 重 要 的 。 例 如 ， 在 发 送 文件 时 如 何 选 
择 一 个 合适 的 调度 策略 就 是 一 个 重要 的 研究 内 容 ，BitTorrent 或 网 络 编码 使 用 的 下 载 
策略 被 证 明 在 长 期 和 大 规模 下 载 的 情况 下 是 一 个 高 效 的 工具 ”1。 然 而 ， 随 着 内 容 
分 发 技术 的 发 展 ， 也 不 断 出 现 了 一 些 新 的 挑战 ， 如 播客 。 因 此 ， 鉴 于 新 兴 的 内 容 共 享 
和 分 发 策略 的 要 求 ， 有 必要 验证 上 述 策略 是 否 仍 具有 适用 性 。 

在 社区 环境 中 ， 文 件 共享 和 流 媒体 直播 应 用 正在 迅速 发 展 起 来 。 这 些 应 用 和 其 他 
一 些 依赖 连续 数据 流 的 应 用 〈 如 从 IPTV 到 大 规模 多 人 在 线 游戏 ) 都 对 系统 有 一 些 特 
殊 的 要 求 ， 例 如 它们 对 延 时 极其 敏感 ， 需 要 组 通信 功能 以 及 QoS 保障 。 很 多 解决 方法 
已 经 提出 ,但 都 没有 得 到 广泛 的 应 用 。 目 前 ， 为 连续 数据 流 设计 的 协议 不 再 完全 依赖 
于 传统 的 客户 端 /服务 器 模式 ， 可 以 将 接收 者 组 织 成 一 个 覆盖 网 络 ， 并 按照 POP 的 模 
式 实现 互相 协作 。 

最 近 提 出 的 基于 P2P 覆盖 的 直播 音频 /视频 流 媒 体 的 相关 方案 来 源 于 最 初 的 将 应 
用 层 组 播 扩 展 到 终端 系统 的 工作 "" 。 第 一 代 控 制 驱动 的 方法 重点 在 于 根据 控制 平台 
建立 一 个 初步 的 覆盖 ， 通 常 是 按照 网 状 网 或 者 树 状 网 实施 。 第 二 代 覆 盖 ， 通 常 是 构造 
一 个 生成 树 来 管理 实际 的 数据 传输 。 点 对 点 传播 ( Peercast) 5 是 由 于 流行 并 且 拥 有 
大 量 的 受众 而 成 为 最 有 名 的 例子 。 大 量 的 工作 旨 在 改进 点 对 点 传播 的 控制 平台 ， 以 解 
决 P2P 覆盖 的 高 动态 性 ， 如 Nice 采用 了 一 种 复杂 的 聚 类 方案 "] 。 近 期 的 研究 工作 都 
集中 在 使 用 混合 树 结构 来 改善 系统 鲁 棒 性 ， 如 Bullet 的 工作 所 。 新 一 代数 据 驱 动 的 
方法 强调 直接 处 理 数 据 的 需要 。 对 等 节点 之 间 交 换 可 用 的 数据 ， 然 后 根据 它们 需要 的 
数据 选择 邻 节 点 所 。 此 外 ， 如 epidemic 算法 ，DonetL 被 提出 ， 以 改善 数据 分 发 性 能 。 
可 以 看 出 ，P2P 流 媒 体 直播 已 经 成 为 现实 。 尽 管 如 此 ， 迄 今 为 止 还 没有 证 明 它 们 在 大 
规模 数据 中 使 用 的 有 效 性 ， 使 用 仿真 方法 可 以 验证 这 种 动态 结构 的 可 行 性 ” 。 另 一 
种 备 选 方案 是 在 实际 测试 平台 上 研究 专门 的 应 用 ， 如 PlanetLab’, P2P 流 媒体 直播 
的 最 大 规模 的 应 用 与 IPTV 相关 ， 并 涉及 一 些 相应 的 专用 协议 和 架构 331。 
因此 ， 需 要 进行 分 析 的 只 能 是 它们 的 行为 而 非 协 议 。 

社区 网 络 中 对 等 节点 的 行为 起 了 关键 的 作用 。 一 端 是 提供 资源 但 不 求 任何 回报 的 
“无 私 ” 节 点 ， 另 一 端 是 只 求 服务 但 不 提供 任何 资源 的 节点 ， 实 际 上 这 是 系统 中 没有 
任何 共享 激励 时 的 一 种 “理智 ”行为 。 因 此 ， 为 了 在 系统 和 个 别 对 等 节点 中 达到 系 
统 资源 的 最 佳 利 用 ， 某 种 激励 机 制 是 必须 要 有 的 ， 这 也 是 目前 的 一 个 比较 活路 的 研究 
领域 。 


15.2.4 内 容 服务 网 络 
内 容 分 发 设施 的 上 层 是 内 容 服务 网 络 。 一 个 内 容 服务 网 络 是 提供 一 系列 的 服务 来 
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优化 用 户 体 验 的 一 个 网 络 基础 设施 。 用 户 能 够 通过 这 些 服务 来 实现 轻松 导航 ， 并 且 根 
据 需要 获得 个 性 化 的 内 容 。 实 际 上 ， 这 个 想法 是 通过 将 所 谓 的 内 容 服务 与 基础 网 络 结 
构 相 结合 来 提供 一 个 内 容 服务 的 网 络 ， 并 由 此 创建 一 个 内 容 网 络 。 内 容 服 务 网 络 包含 
大 量 的 子 区 域 ， 主 要 分 为 : 

1) 内 容 服 务 网 络 架构 和 服务 框架 ,包括 相关 的 内 容 服 务 网 络 的 架构 模型 。 

2) 服务 交互 ， 包含 服务 整合 和 使 用 的 所 有 问题 ， 如 服务 查找 、 服 务 描述 、 服 务 
质量 、 服 务 水 平 协议 等 。 

3) 服务 实例 ， 包 括 在 内 容 服务 网 络 中 改善 分 发 和 用 户 体验 的 具体 的 内 容 服务 。 

创建 一 个 内 容 服务 网 络 的 目的 是 希望 能 以 开放 的 方式 整合 那些 能 产生 和 再 利用 资 
源 的 工具 和 机 制 ， 这 主要 是 为 了 社区 成 员 的 利益 并 且 人 允许 通过 创新 合作 进行 商业 应 
用 。 为 了 实现 这 一 目标 ， 就 必须 要 有 一 种 合适 的 能 将 内 容 服 务 轻松 “插入 ”到 服务 
网 络 中 的 模式 和 架构 。 最 近 ， 研 究 人 员 提 出 了 面向 服务 架构 (SOA) 的 概念 ， 以 此 达 
到 通过 底层 IT 架构 为 业务 过 程 提供 优化 支持 的 目的 。 面 向 服务 架构 的 主要 优势 体现 
在 部 件 的 可 重用 性 上 ， 它 可 以 很 容易 地 组 织 和 建立 灵活 、 模 块 化 的 应 用 。 因 此 ， 它 似 
乎 能 够 成 为 内 容 服 务 网 络 的 一 个 合适 的 抽象 形式 。 目 前 ， 面 向 服务 的 架构 模式 主要 是 
使 用 网 络 服务 来 实现 ” 。 

在 基于 服务 的 内 容 网 络 架构 中 ， 主 要 有 两 个 与 服务 交互 相关 的 研究 内 容 ， 即 服务 
的 描述 方式 和 分 发 恰当 服务 的 方式 。 服 务 描述 是 一 个 基本 问题 ， 用 来 确保 服务 能 方便 
用 户 接 入 以 及 管理 简单 。 由 万 维 网 联盟 (W3C) 定义 的 语义 网 ?是 这 一 领域 比较 经 典 
的 例子 。 在 不 同 的 表达 力 水 平 上 ， 已 提出 几 个 主要 的 形式 ， 从 简单 的 语义 标记 语法 
Cin RDF?) 到 本 体 (如 OWL”), 一 个 基于 OWL 的 Web 服务 本 体 (OWL-S) 已 
经 专门 为 网 络 服务 开发 出 来 ， 用 来 清晰 地 描述 它们 的 属性 ”” 。 在 最 近 的 一 个 提议 中 
定义 了 语义 网 络 服务 框架 (SWSF)" 1 ， 其 中 包括 了 语义 网 络 服务 语言 。 在 服务 分 发 
领域 中 目前 有 很 多 工作 正在 进行 ， 如 UDDI'” 和 ebXML 注册 "*! , ， 都 支持 基于 名 称 和 
类 型 的 查找 服务 ， 并 且 根 据 分 类 进行 绑 定 。 另 一 个 特定 的 成 果 是 网 络 服务 的 动态 发 现 
(WS - Dynamic Discovery) ™ ， 它 是 基于 一 个 本 地 区 域 的 网 络 服务 探索 机 制 ， 通 过 本 
地 范围 内 的 组 播 来 实现 网 络 服务 的 搜索 。 

服务 实例 是 在 通信 设施 内 部 (或 者 边缘 ) 提供 的 一 些 增值 服务 ， 实 现 对 内 容 分 
发 的 定制 和 编辑 。 在 这 方面 可 以 发 掘 出 许多 种 不 同类 型 的 服务 。 例 如 ， 内 容 转 换 服务 
和 质量 体验 服务 等 。 内 容 编 辑 的 相关 问题 已 经 研究 了 很 长 时 间 。 例 如 ，Smith 等 
人 "提出 的 方法 将 异 构 终端 进行 针对 Ad - Hoc 的 修改 ， 他 们 的 研究 重点 是 对 内 容 表 
示 技 术 的 定义 ， 其 中 信息 金字 塔 (Info Pyramid) 起 着 重要 的 作用 。Lemlouma a J 1e 
为 内 容 协商 (content negotiation) 提出 了 一 种 新 技术 。 他 们 提出 了 协商 和 转换 核 (NAC), 


O HNA (Semantic Web) 是 蒂 姆 . 伯 纳 斯 - 李 (Tim Bemers - Lee) 于 1998 年 提出 的 一 个 全 球 信 
息 网 联盟 的 概念 ， 其 核心 是 通过 给 全 球 信息 网 上 的 文档 ( 如 HTML) 添加 便于 理解 的 元 数据 
(Meta data) ， 使 整个 互联 网 成 为 一 个 通用 的 信息 交换 媒介 。 一 一 译 者 注 
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这 是 为 异 构 终 端 提 供 协 商 和 转换 多 媒体 服务 的 一 个 基本 系统 。Lum 等 人 5 强调 了 内 
容 转 换 的 必要 性 ， 并 使 用 一 个 决策 引擎 作为 逻辑 实体 来 决定 如 何 转 换 特定 内 容 ， 以 满 
足 用 户 实际 要 求 。Boll 等 人 "提出 了 一 个 基于 强化 的 三 阶段 转换 策略 ， 即 预 转换 、 
静态 转换 和 动态 转换 。 预 转换 过 程 中 实现 了 一 个 内 容 的 替代 版 本 ; 静态 转换 过 程 中 删 
除了 不 相关 的 替代 版 本 ; 动态 转换 过 程 在 前 两 阶段 筛选 出 的 版 本 中 选择 最 合适 的 
版 本 。 

以 前 对 终端 用 户 体验 的 质量 评价 的 研究 工作 主要 适合 于 MPEG - 2 视频 ， 这 些 方 
法 是 基于 主观 或 者 客观 过 程 。 主 观 方法 假定 人 的 经 验 作为 唯一 的 分 级 因素 ， 即 质量 体 
验 ; 客观 过 程 的 执行 没有 人 工 干预 ， 因 此 能 给 出 更 稳定 的 结果 ， 但 是 不 一 定 能 反映 用 
户 对 质量 的 真实 看 法 。 客 观 指标 的 例子 有 峰值 信 噪 比 (PSNR ) 、 平 均 绝 对 误差 
(MAE) 、 均 方 误差 (MSE) 和 均 方 根 误差 (RMSE) 已 '”'“] 。 使 用 客观 指标 评价 视频 
质量 的 方法 通常 不 需要 充分 考虑 人 类 的 视觉 感官 ， 而 人 的 感官 能 有 效 地 感觉 到 许多 明 
显 的 误差 。 因 此 ， 客 观 指标 的 评价 结果 可 能 不 会 反映 用 户 的 真实 感受 ， 这 就 需要 使 用 
一 些 结合 人 类 视觉 感官 的 其 他 方法 焉 '”'% 。 本 章 的 研究 目标 是 在 内 容 服务 设施 内 加 
入 用户 体 验 质量 指标 ， 将 其 作为 设施 内 的 一 个 服务 。 


15.3 写 给 使 用 者 


与 长 期 研究 中 面临 的 挑战 相 比 ， 业 内 在 短期 研究 中 的 挑战 是 : 不 投机 ， 更 多 地 关 
注 那 些 可 以 在 未 来 几 年 内 实现 的 技术 。 接 下 来 ， 本 节 将 讨论 现 有 架构 内 若干 方面 的 
问题 。 


15.3.1 社区 网 络 


移动 性 是 过 去 几 年 的 一 个 研究 课题 ， 目 前 已 经 针对 OSI 的 不 同 层 开 发 了 相应 的 解 
决 方案 。 具 体 来 说 ，IETF 已 经 在 IP 层 制 定 了 移动 解决 方案 的 标准 ， 即 移动 Pv“ 和 
移动 1Pv65%1 。 此 外 ， 它 给 IPv6 制定 了 三 个 额外 的 标准 : 快速 切换 所 、 分 层 的 移动 
IPv6 ' 和 网 络 移动 性 。 

大 量 文献 69 中 都 指出 ， 网 络 中 的 设备 在 移动 过 程 中 保持 连接 仍然 是 一 个 挑战 。 
此 外 ， 这 些 协 议 并 没有 明确 支持 异 构 网 络 环境 。 实 现 异 构 环境 下 的 无 颖 切换 还 存在 许 
多 困难 ， 特 别 是 考虑 到 多 宿主 的 时 候 。multihoming' 技术 可 以 提高 互联 网 连接 的 可 
靠 性 ， 它 使 用 多 个 接口 连接 不 同 的 ISP。 在 这 种 情况 下 ， 一 个 使 用 multihoming 技术 的 
网 络 节 点 可 以 使 用 多 个 不 同 的 路 径 进 行 通信 。 很 多 文献 ””"” 中 讨论 了 multihoming 
技术 带 给 静态 节点 或 网 络 的 益处 。 然 而 ， 在 移动 和 异 构 网 络 中 使 用 multihoming 仍然 
是 一 个 相对 新 颖 的 、 面 临 多 种 挑战 的 研究 课题 。 

IEEE 最 近 发 布 的 IEEE 802.21"”3 旨 在 实现 异 构 网 络 之 间 的 交互 ， 其 中 包括 802 
网 络 和 非 802 网 络 。IEEE 802. 11e 任务 组 完善 了 802.11 MAC， 提 供 具有 服务 质量 保 
证 的 音频 和 视频 应 用 "! IEEE 802. 11e 的 最 新 批准 版 本 给 出 了 区 分 流量 类 别 的 DCF 
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算法 的 一 种 改进 方法 。 

由 于 IEEE 802.11 DCF 的 分 布 式 特性 ， 上 述 处 于 审阅 中 的 协议 也 可 用 在 多 跳 通 
信 的 情况 下 5“ "9 。 目 前 ，Ad - Hoe 网 和 mesh 网 领域 ”是 科学 界 关 注 的 重点 。 通 过 
多 跳 方 式 进行 通信 和 路 由 问题 是 紧密 相关 的 ， 且 仍然 是 一 个 研究 热点 。 在 一 个 网 络 区 
域内 ， 可 用 宽带 的 信息 是 一 个 重要 因素 ， 因 为 大 部 分 的 路 由 协议 对 QoS 的 支持 都 是 基 
于 该 区 域内 的 可 用 带宽 。 

最 后 ， 在 这 个 很 多 问题 都 未 解决 的 领域 内 ， 网 络 管理 和 设备 配置 主要 依赖 于 对 用 
户 不 当 行 为 和 流量 异常 的 检测 ， 这 就 使 我 们 必须 高 度 关注 那些 对 网 络 安全 性 造成 威胁 
的 方面 ， 如 分 布 式 拒绝 服务 (DDoS) 攻击。 在 MAC 层 的 无 线 mesh 网 中 对 异常 行为 
的 检测 尤其 重要 ， 而 对 流量 异常 的 检测 机 制 则 充满 了 整个 CDN。 


15.3.2 分 发 设施 


在 改善 基于 PP 的 内 容 分 发 设施 时 ， 面 临 的 挑战 在 于 如 何 创 建 能 更 好 适应 内 容 
服务 的 特殊 需求 的 覆盖 网 。 

为 了 更 好 地 将 传统 的 网 络 内 容 发 布 至 用 户 处 ， 可 能 需要 根据 用 户 的 网 络 位 置 将 他 
们 到 为 一 个 群 组 。 这 样 的 一 个 用 户 群 可 能 会 有 助 于 高 效 地 将 内 容 副 本 或 代理 缓存 
癌 网 络 中 用 户 分 布 比较 密集 的 部 分 移动 。 参 考 文献 [32] 中 给 出 了 一 个 实时 网 络 
用 户 聚 类 方法 ， 从 网 络 服务 器 日 志 中 提取 用 户 端的 下 地 址 以 及 基于 边界 网 关 协 议 
(BGP) 路 由 信息 的 地 址 聚 类 。 此 类 方法 也 许 只 能 在 传统 的 CDN 上 实现 ， 因 为 内 容 
提供 商 和 CDN 服务 提供 商 的 密切 配合 ， 使 内 容 提 供 商 能 以 最 优 的 方式 进行 内 容 
分 发 。 

最 近 ，P2P 模型 出 现在 VoIP 的 应 用 中 ， 如 Skype 网 络 电话 ， 并 在 搜索 用 户 位 置 和 
传递 语音 包 等 方面 显示 出 很 好 的 效果 。 选 择 一 个 或 多 个 合适 的 对 等 节点 来 传递 语音 
是 关系 到 质量 、 可 扩展 性 以 及 VoIP 系统 成 本 的 关键 因素 。 然 而 ，Ren FAS” 的 研究 
表明 ， 选 择 对 等 节点 需要 的 网 络 探测 活动 可 能 会 影响 整个 应 用 的 性 能 和 灵活 性 。 为 了 
降低 那些 无 关 的 P2P 覆盖 网 开销 ，Nakao 等 人 "提出 ,通过 在 网 络 (底层 ) 中 提供 
一 些 基础 服务 ， 可 以 恰当 和 有 效 地 创建 那些 并 发 的 、 与 特定 应 用 相关 的 覆盖 。 

P2P 应 用 中 表现 出 的 男 一 个 排 成 是 它们 产生 了 大 量 流量 来 “逃避 ”ISP 对 流量 工 
程 所 做 出 的 努力 “ 。 最 近 的 研究 “试图 在 P2P 应 用 与 ISP 之 间 寻 求 一 种 较 好 的 合作 
方式 , 使 双方 可 以 达到 双赢 的 目的 。 

最 后 ， 目 前 内 容 分 发 设施 的 经 典 解决 方案 在 设计 上 很 好 地 考虑 了 网 络 的 拓扑 或 其 
所 处 的 广域网 。 然 而 ， 这 些 解决 方案 具有 一 定 的 局 限 性 ， 因 为 它们 并 未 关注 客户 端 和 
终端 用 户 群 的 “最 后 一 公里 ”( 即 最 终 连接 ) ， 而 是 仅仅 将 其 视 为 与 客户 端的 一 个 连 
接 ， 并 且 他 们 并 不 考虑 网 络 中 内 容 分 发 设施 与 客户 端 之 间 连 接 的 拓扑 关系 。 最 近 的 技 
术 发 展 清 楚 地 表明 ， 相 邻 网 络 和 家 庭 网 络 将 会 把 客户 端 连接 到 核心 CDN。 分 发 路 径 
的 改变 也 在 相 邻 网 络 和 终端 用 户 网 络 中 进行 ， 并 且 它 和 广 域 分 发 设施 的 整合 是 一 个 尚 
未 被 系统 化 解决 的 问题 。P2P 和 经 典 CDN 的 结合 似乎 是 一 个 很 好 的 起 点 ，Cowan 等 
人 就 较 早 地 在 这 一 课题 开展 了 大 量 的 研究 工作 。 


第 15 章 社区 网 络 的 基础 设施 305 








15.3.3 内 容 服 务 网 络 


适用 于 典型 社区 网 络 成 员 的 内 容 服务 主要 关注 的 是 对 视听 内 容 的 消费 ， 如 Real- 
Player 和 Windows Media Player。 此 外 ， 内 容 的 提供 可 能 是 通过 基于 网 络 的 服务 和 流 
媒体 服务 来 实现 的 。 虽 然 如 此 ， 用 于 内 容 创建 和 重新 发 布 的 服务 和 应 用 (包括 管理 
和 编辑 ) 仍然 不 可 用 。 因 此 ， 内 容 服务 网 络 所 提供 的 服务 目前 仍然 还 是 局 限 在 媒体 
的 提供 和 消费 上 。 另 外 ， 用 户 基本 上 还 不 能 自由 地 添加 他 们 自己 需要 的 内 容 ， 也 不 能 
够 创建 他 们 自己 的 社区 。 但 是 ， 像 YouTube 和 MySpace 这样 的 网 站 已 经 显示 出 用 户 之 
间 有 分 享 信息 和 内 容 的 强烈 需求 。 然 而 ， 和 这 些 例 子 刚 好 相反 ， 在 社区 网 络 中 有 一 个 
“目标 受众 ”， 那 就 是 社区 成 员 。 

这 暗示 了 ， 一 方面 有 必要 开发 出 新 的 服务 ， 以 提供 给 用 户 更 多 的 自由 来 实现 他 们 
之 间 的 交互 和 内 容 共享 ; 另 一 方面 ， 需 要 有 更 多 的 服务 允许 用 户 能 够 创建 (新 的 ) 
内 容 ， 建 立 他 们 自己 的 社区 ， 并 且 能 够 由 他 们 自己 控制 其 环境 。 这 超出 了 现 有 用 户 只 
能 基本 地 管理 和 共享 内 容 这 一 模式 (如 FlickR) 。 在 新 模型 中 ， 用 户 还 能 够 (在 一 定 
ERE) 决定 内 容 如 何 发 布 〈 如 通过 视频 流 服务 ) ， 以 及 在 资源 不 足 的 情况 下 该 怎么 
办 ( 即 应 该 运用 哪 种 转换 策略 ) ， 甚 至 决定 应 该 使 用 哪 种 激励 机 制 。 因 此 ， 应 该 有 两 
种 不 同 的 基本 服务 类 型 ， 即 较为 传统 的 内 容 服 务 以 及 内 容 和 设施 支持 服务 ， 特 别 而 
言 ， 现 在 所 提供 的 内 容 和 设施 支持 服务 还 并 不 完善 。 

在 这 一 方面 ， 为 了 达到 开放 性 和 兼容 性 的 要 求 ， 拥 有 一 个 允许 不 同 服务 提供 商 提 
供 他 们 的 内 容 或 者 支持 服务 的 服务 框架 是 很 重要 的 。 受 网 络 服务 的 启发 ， 需 要 开发 一 
个 适当 的 内 容 服务 网 络 架 构 ， 可 以 用 来 容纳 优化 内 容 发 布 和 使 用 的 全 部 服务 。 这 为 商 
业 和 专用 服务 供应 商 提供 了 一 个 有 效 的 机 会 ， 因 为 这 使 得 它们 能 够 在 社区 内 容 网 络 环 
境 中 长 期 提供 服务 。 这 样 的 内 容 服务 网 络 框架 为 提供 服务 尤其 是 更 加 面向 社区 的 服务 
开辟 了 有 效 的 市 场 。 为 了 实现 这 个 目标 ， 首 先 需要 解决 下 一 节 提 到 的 问题 。 


15.4 ”未 来 研究 方向 


本 节 介 绍 研究 中 面临 的 长 期 性 挑战 。 同 时 , “卓越 网 络 内 容 ”(CONTENT Network — 
of - Excellence) 也 暴露 出 一 些 问题 ， 本 节 也 将 介绍 用 于 解决 这 些 挑战 的 研究 方向 。 


15.4.1 社区 网 络 


以 内 容 发 布 中 的 通信 问题 为 例 ， 其 研究 内 容 包括 流 媒 体 、 网 络 缓存 、 服 务 质量 以 
及 P2P 等 问题 。 这 些 问 题 都 已 经 得 到 了 充分 的 分 解 ， 并 有 大 量 的 相关 研究 人 员 从 事 
各 种 子 问题 的 研究 。 对 于 基于 社区 的 内 容 网 络 ， 由 于 不 必 投资 昂 贵 的 有 线 设施 就 能 够 
部 署 无 线 mesh 网 ， 因 此 它 正 变 得 越 来 越 重要 。 然 而 ， 这 个 方面 仍然 存在 大 量 的 问题 
有 待 研究 ， 如 链 路 质量 、 信 道 分 配 、 路 由 和 网 关 的 选择 等 。 在 将 无 线 mesh 网 完全 集 
成 到 内 容 网 络 之 前 ， 这 些 问题 都 要 被 研究 清楚 。 在 无 线 mesh 网 、 网 络 选择 和 其 他 相 
关 问 题 的 研究 进展 基础 上 ， 可 以 设想 到 在 这 个 年 代 末 ， 集 成 多 宿主 网 络 将 发 挥 其 
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作用 。 

为 了 实现 无 颖 通信 ， 需 要 用 到 端 到 端 (End-to-End, E2E) 的 设施 。 这 种 设施 
在 统一 架构 下 集成 不 同 的 网 络 类 型 ， 解 决 如 端 到 端 服务 质量 、 端 到 端 服务 质量 路 由 和 
流量 工程 方面 的 问题 。 另 一 个 研究 分 支 则 是 处 理 异 常 行为 检测 和 使 内 容 网 络 远离 攻 
击 。 这 项 研究 将 催生 出 一 种 对 异常 行为 敏感 的 网 络 ， 使 其 在 网 络 保护 和 检测 方面 具有 
自 恢复 能 力 。 另 外 ， 并 行 开发 是 内 容 的 自主 分 发 ,包括 基于 P2P 原理 的 自主 通信 和 架 
构 ， 其 研究 内 容 不 仅 涉及 内 容 分 发 (如 P2P 流 )， 也 包括 信任 、 协 调和 管理 等 方面 。 
自主 内 容 分 发 也 将 包括 某 些 服务 ， 将 在 下 文 讨论 。 社 区 内 容 网 络 内 部 的 高 互动 应 用 仍 
然 是 一 个 重大 的 挑战 ， 本 节 设 想 在 下 一 个 十 年 ， 基 于 不 同 网 络 类 型 的 高 度 异 构 设 施 将 
能 够 解决 这 些 问题 ， 并 提供 必要 的 技术 支持 。 


15.4.2 分 发 设施 


未 来 社区 网 络 在 内 容 分 发 和 服务 设施 方面 面临 的 核心 挑战 是 开发 能 整合 自治 覆盖 
结构 和 内 容 服务 〈 如 内 容 管理 ) 的 自治 内 容 网 络 (CN) 。 自 治 内 容 网 络 将 提高 传统 
CDN 的 可 靠 性 和 效率 ， 并 降低 管理 成 本 。 此 外 ， 自 治 内 容 网 络 还 将 扩展 传统 解决 方 
案 的 应 用 领域 ， 如 向 移动 用 户 提供 透明 的 流 媒 体 、 提 供 交互 多 媒体 应 用 或 者 针对 社区 
网 络 做 自 适 应 的 调整 。 这 方面 的 研究 需要 为 自治 内 容 网 络 设计 新 的 架构 ， 包 括 集成 内 
容 管 理 和 内 容 分 发 的 新 方法 以 及 有 效 传输 控制 信息 的 新 协议 。 这 里 ， 需 要 解决 的 问题 
不 仅 涉及 分 发 面临 的 实际 问题 ， 也 包括 如 何 正确 地 协调 内 容 管 理 、 服 务 功能 和 通信 。 
后 者 可 以 通过 使 用 跨 层 信息 流 来 实现 。 

目前 的 研究 重心 仅仅 关注 于 特定 的 应 用 领域 ， 如 视频 点 播 (VoD) IPTV 或 Web 
浏览 等 ， 并 且 主 要 是 面向 公平 地 刚性 分 发 结构 。 传 统 CDN 中 使 用 的 方法 受到 相当 大 
的 限制 ， 相 对 而 言 未 来 的 P2P 技术 需要 具有 更 好 的 自 适应 性 ， 并 采取 更 加 灵活 的 
方法 。 

目前 的 研究 ， 尚 没有 系统 性 的 解决 方案 ， 也 没有 一 个 合适 的 架构 模型 来 促进 相关 
技术 发 展 。 其 中 的 研究 的 重点 是 如 何 使 内 容 分 发 设施 和 内 容 管理 功能 能 很 好 地 同步 起 
来 。 为 了 达到 这 个 目标 ， 对 跨 层 交互 的 研究 意义 重大 。 这 包括 在 通信 架构 不 同 层 之 间 
交互 的 功能 和 接口 工作 ， 目 的 是 促进 新 兴 的 内 容 网 络 的 发 展 和 实施 以 及 对 内 容 创建 的 
管理 ， 使 内 容 的 产生 更 快 、 访 问 更 容易 。 

未 来 的 研究 需要 加 快 内 容 制作 和 分 发 的 融合 ， 以 及 弥合 这 两 方面 之 间 的 技术 差 
距 ， 在 此 基础 上 ， 同 一 个 框架 内 实现 内 容 创作 、 节 目 形式 以 及 端 到 端 内 容 发 布 的 可 能 
性 正在 成 为 现实 。 

在 改善 内 容 分 发 时 ， 一 个 指导 原则 是 对 其 进行 修改 以 适应 网 络 环境 ， 如 果 设 计 
得 当 ， 就 可 以 得 到 更 好 的 系统 利用 率 和 效率 。 但 是 ， 如 果 在 两 个 相互 独立 的 子 系 
统 间 使 用 这 种 修改 版 本 ， 也 就 是 说 不 采取 任何 进一步 的 预防 措施 ， 而 是 在 自 适应 
覆盖 的 顶部 采用 自 组 织 的 协作 缓存 方案 ， 则 可 能 会 导致 这 样 一 种 情况 的 发 生 : 在 
一 个 层面 的 修改 版 本 会 阻挠 在 系统 其 他 部 分 执行 的 修改 版 本 。 此 外 ， 这 种 状况 可 
能 促使 修改 版 本 只 用 到 通过 网 络 测量 所 产生 的 数据 。 因 此 ， 跨 层 的 问题 代表 了 这 
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方面 独特 的 挑战 。 


15.4.3 ”内容 服务 网 络 


尽管 未 来 需要 更 先进 、 更 好 的 内 容 服务 ， 但 将 现 有 的 服务 实例 和 更 复杂 的 服务 结 
合 起 来 ， 共 同 来 构建 内 容 服务 也 是 十 分 重要 的 。 不 同 的 服务 提供 商 可 以 提供 从 设施 支 
持 ， 到 实际 的 内 容 的 服务 。 例 如 ， 前 者 可 以 ， 根 据 特 定 的 服务 水 平 协议 (SLA) 提供 
实时 视频 流 设施 。 这 项 服务 反 过 来 又 可 以 利用 其 他 的 设施 服务 (如 QE 评估 服务 ) 。 
用 户 或 社会 团体 可 以 租用 其 服务 ， 用 来 实现 自己 内 容 的 分 发 ， 并 在 它 上 面 建立 有 效 的 
内 容 分 发 服务 。 

为 了 建立 这 样 一 个 框架 ， 必 须 很 好 地 定义 相关 的 概念 和 基本 架构 来 作为 支撑 。 同 
时 ， 还 要 为 灵活 的 服务 供应 预 留 空间 。 在 这 样 一 个 内 部 ， 服 务 本 身 形 成 了 一 个 内 容 服 
务 网 络 ， 每 个 服务 提供 一 个 独特 的 、 自 成 一 体 的 服务 功能 。 可 以 通过 一 些 设施 来 发 布 
服务 ， 并 且 形 成 一 个 协调 机 制 的 网 状 网 ， 该 网 络 既 可 以 使 用 标准 服务 接口 协调 ， 也 可 
以 使 用 特定 的 服务 协议 。 内 容 服务 设计 者 的 作用 是 允许 不 同 的 服务 被 置 于 整个 服务 框 
架 中 ， 使 它们 成 为 内 容 网 络 设施 的 一 部 分 。 在 这 方面 的 服务 包括 从 网 络 架构 服务 
(如 QoS 和 QoE 评估 ) 到 分 发 支持 服务 (如 转 码 和 内 容 转换 )， 以 及 以 内 容 为 中 心 的 
服务 〈 如 视频 摘要 和 索引 ) 。 

该 服务 的 架构 遵循 了 通用 的 面向 服务 的 架构 (SOA) 模型 。 该 模型 提供 了 一 种 通 
用 的 服务 规范 ， 所 有 内 容 服务 方面 的 问题 都 要 遵守 这 一 规范 。 这 种 规范 为 个 性 化 的 服 
务 预 留 了 足够 的 空间 ， 以 细 化 整个 服务 接口 和 功能 。 内 容 服 务必 须 提 供 一 系列 的 接 
口 ， 通 过 这 些 接口 与 其 他 服务 或 者 应 用 进行 通信 。 内 部 组 织 和 服务 结构 既 不 是 这 个 模 
型 的 一 部 分 ， 也 不 是 服务 特定 接口 的 描述 或 服务 特定 功能 规范 的 一 部 分 。 

服务 可 以 是 有 状态 的 或 无 状态 的 。 有 状态 服务 必须 为 用 户 提供 一 个 接口 来 查询 其 
执行 状态 ， 它 也 应 该 作为 一 个 提供 服务 质量 协议 的 一 部 分 ， 这 需要 一 个 服务 水 平 协议 
规范 。 服 务 水 平 协议 本 身 是 一 个 具体 服务 ， 它 的 格式 需要 在 服务 描述 中 进行 定义 。 上 
下 文 感知 指 的 是 从 应 用 或 环境 上 下 文中 获取 信息 来 控制 和 管理 服务 。 通 过 跨 层 交互 ， 
服务 能 够 从 底层 和 系统 组 件 中 检索 信息 。 通 过 这 种 方式 它 能 更 好 地 感知 系统 环境 ， 并 
可 以 适应 或 尝试 去 影响 底层 组 件 。 用 户 交互 允许 由 用 户 根据 自己 的 偏好 来 制定 规范 以 
使 服务 能 适应 用 户 的 需求 。 图 15. 3 显示 了 通用 内 容 服务 模型 。 





图 15.3 ”内容 服务 模型 
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内 容 服 务 框架 提供 一 个 语 境 来 放置 服务 。 服 务 框架 内 部 中 ， 至 关 重 要 的 内 容 是 服务 描 
述 及 其 在 服务 注册 表 中 的 表示 。 通 过 标准 接口 ， 服 务 可 以 经 由 服务 注册 表 调 用 其 他 服务 。 
这 种 方法 允许 内 容 服务 之 间 动 态 、 自 动 的 组 合 ， 这 为 中 介 服 务 开辟 了 新 的 商业 机 会 。 


15.4.4 ” 跨 层 问题 


研究 界 普 遍 认为 ， 分 层 的 系统 架构 除了 自身 优势 外 也 有 一 些 明显 的 缺陷 。 为 了 使 
资源 用 于 分 布 式 应 用 ， 对 网 络 层 信 息 的 访问 是 十 分 必要 的 。 跨 层 的 方法 就 是 用 来 实现 
这 一 目标 , 但 是 它们 又 是 为 特定 的 解决 方案 而 设计 的 。 因 此 ， 了解 和 开发 出 一 个 比 纯 
分 层 方案 更 好 的 架构 是 一 个 挑战 。 然 而 ， 跨 层 问题 在 未 来 社区 网 络 的 通信 系统 中 特别 
重要 ， 因 此 有 必要 使 用 自主 解决 方案 ， 如 自 适应 功能 等 。 如 前 所 述 ， 不 同 功能 的 独立 
修改 版 可 能 会 因为 它们 之 间 需 要 共享 资源 而 产生 相互 影响 ， 例 如 双方 可 能 都 会 对 网 络 
流量 带 来 影响 。 解 决 这 一 挑战 的 第 一 步 ， 是 为 每 一 层 确定 一 个 衡量 标准 ， 包 括 服 务 质 
量 参数 和 资源 消耗 指标 ， 以 及 各 层 之 间 的 依赖 关系 。 虽 然 这 一 步 似乎 微不足道 ， 但 要 
想 成 功 地 实现 ， 上 述 指标 及 其 定义 就 必须 要 被 这 一 领域 的 整个 研究 界 所 接受 和 使 用 。 
目前 ,正在 使 用 许多 不 同 的 指标 和 定义 ， 它 们 之 间 也 互 不 兼容 。 模 拟 参 数 之 间 的 依赖 
关系 也 需要 包括 对 该 系统 要 素 的 功能 行为 的 理解 。 为 了 应 对 这 一 挑战 ，CONTENT 
Network — of - Excellence 开发 了 一 个 适合 通信 网 络 系统 的 通用 基准 ， 这 是 一 种 模块 化 
的 方法 ， 通 信 网 络 系统 的 不 同 层 可 作为 被 测试 系统 ， 并 且 其 他 各 层 可 以 分 别 表示 环境 
和 工作 负载 。 


15.5 CONTENT 方法 


CONTENT 体系 框架 并 不 为 基于 社区 的 内 容 网 络 提供 实施 蓝图 ， 而 更 多 的 是 提供 
准则 ， 且 根据 这 种 网 络 的 发 展 来 制定 准则 。 为 了 验证 所 提出 的 准则 和 框架 的 内 部 机 
制 ， 这 个 框架 正在 评估 各 个 方面 的 内 容 。 在 这 里 ， 策 略 是 实施 的 关键 因素 ， 并 通过 测 
量 和 仿真 来 评估 它们 的 性 能 。 该 框架 是 在 三 个 架构 层次 上 实施 的 ， 或 在 涉及 跨 层 活动 
的 情况 下 实施 的 。 本 节 将 对 CONTENT 中 的 三 个 样本 进行 研究 ， 通 过 得 到 的 结果 说 明 
这 一 点 。 

在 社区 网 络 层 ， 使 用 仿真 的 方式 及 在 实际 测试 平台 测量 的 方式 ， 研 究 移动 终端 在 
垂直 和 水 平 切换 过 程 中 表现 出 来 的 性 能 和 服务 质量 ， 同 时 仿真 也 用 来 验证 无 线 网 络 中 
适合 带宽 估计 的 新 方案 。 最 后 ， 在 实际 测试 平台 上 的 测量 数据 用 来 在 网 络 层 分 析 和 确 
定 适当 的 服务 质量 指标 ， 其 他 指标 可 能 用 于 更 高 的 层次 。 作 为 一 个 初步 的 结果 ， 使 用 
本 节 方法 及 使 用 pathChirp 工具 后 获得 的 瞬时 可 用 带宽 估计 在 图 15. 4 中 显示 。 本 节 研 
究 的 方法 基于 内 棋 的 方式 进行 测量 ， 因 此 不 会 在 估计 可 用 带宽 时 引起 网 络 拥塞 。 图 中 
显示 了 这 一 新 方法 的 效果 ， 且 估计 值 接近 真实 的 可 用 带宽 。 

作为 分 发 设施 的 一 部 分 ，P2P 缓存 机 制 在 本 节 中 进行 了 验证 。 在 这 方面 ， 前 期 工 
作 的 重点 是 P2P 缓存 如 何 确定 其 结构 、 动 态 创建 和 协调 不 同 的 元 素 。P2P 缓存 的 目标 
是 使 内 容 贴近 用 户 。 然 而 ， 与 “常规 ”的 缓存 相 比 ， 某 项 内 容 在 达到 一 定 的 访问 量 
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图 15.4 可 用 带宽 估计 

后 就 不 需要 缓存 了 ， 因 为 这 时 它 已 经 广泛 存在 于 附近 的 邻 节点 。 一 个 想法 是 选择 对 等 
机 (基于 请 求 频率 进行 选择 ) 来 加 入 P2P 缓存 。 内 容 通过 基于 请 求 的 策略 进行 缓存 ， 
当 这 个 内 容 可 用 之 后 ， 就 从 缓存 中 将 它 去 除 。 现 有 的 研究 已 在 5000 和 7000 个 节点 规 
模 和 不 同 的 下 载 方式 上 进行 了 仿真 。 结 果 表 明 ， 主 要 的 开销 源 自 缓存 之 间 的 相互 协 
调 。 由 于 内 容 离 用 户 更 近 ， 因 此 通过 节省 带宽 抵消 了 这 些 开 销 。 同 时 也 发 现 ， 可 以 节 
省 的 带宽 量 很 大 ， 而 额外 的 开销 则 微不足道 。 但 是 ， 具 体内 容 的 大 小 和 访问 模式 是 至 
关 重 要 的 ， 下 一 步 工 作 是 研究 不 同 下 载 速度 和 内 容 交 又 所 带 来 的 影响 。 

除了 使 用 系统 仿真 工具 ， 一 些 原型 也 用 于 展示 该 研究 结果 在 实际 场景 下 社区 网 络 
内 容 分 发 的 应 用 能 力 。 根 据 现 有 的 商业 服务 ， 实 际 场景 ， 用 来 验证 架构 框架 。 我 们 特 
别 研 究 了 一 个 视频 点 播 的 应 用 场景 ， 通 过 提供 视频 和 在 基于 客户 端的 社区 人 口中 创建 
P2P 应 用 ， 社 区 成 员 和 社区 提供 商都 可 以 提供 视频 下 载 。 这 些 视频 可 以 是 免费 的 ， 也 
可 以 是 付费 的 。 例 如 ， 高 尔 夫 爱 好 者 的 社区 就 可 以 提供 专业 高 尔 夫 视频 之 类 的 付费 内 
容 (如 PGA 锦标 赛 的 录像 ) 。 它 既 可 以 提供 收费 的 视频 (如 高 尔 夫 教练 录制 的 如 何 
提高 水 平 的 视频 ) ， 也 可 以 提供 完全 免费 的 视频 供 自由 下 载 。 


15.6 结论 


社区 网 络 为 新 的 内 容 服务 提供 了 很 多 的 机 会 ， 同 时 也 为 社区 成 员 的 沟通 和 互动 提 
供 了 平台 。 在 这 个 模型 中 ， 社 区 成 员 在 网 络 和 节点 方面 (例如 ， 以 无 线 网 状 网 的 方 
R) 提供 资源 ， 他 们 提供 内 容 、 管 理 和 使 用 。 由 于 这 些 都 是 常见 的 终端 用 户 ， 所 以 
不 需要 在 网 络 管理 和 系统 管理 方面 进行 特殊 的 训练 ， 网 络 和 覆盖 层 的 自主 解决 方案 对 
于 减少 人 为 干预 (用 于 建立 和 维护 内 容 分 发 设施 ) 是 十 分 重要 的 。 在 内 容 分 发 设施 中 ， 
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无 线 网 络 和 移动 性 是 十 分 重要 的 部 分 。 因 此 ， 对 于 可 用 资源 进行 动态 、 自 适应 的 服务 
至 关 重 要 。 为 了 提供 自 适 应 解决 方案 的 理论 基础 ， 一 个 最 重要 的 挑战 是 对 跨 层 交互 和 
依存 关系 中 的 功能 和 指标 的 理解 和 建 模 。 此 外 ， 服 务 需要 由 若干 简单 的 服务 实例 动态 
组 合 而 成 ， 这 样 才能 根据 功能 需求 和 可 用 资源 ， 准 确 地 为 用 户 提供 所 需要 的 服务 。 
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16.1 引言 


目前 商业 CDN 提供 商 的 配置 方法 主要 是 在 世界 各 个 位 置 放置 服务 器 集群 。 然 而 ， 
对 于 新 的 CDN 提供 商 来 说 ， 很 难 提供 覆盖 全 球 的 高 质量 服务 ,而且 会 影响 现 有 CDN 
提供 商 的 商业 利益 ， 从 最 近 几 年 CDN 市 场 主要 发 生 的 一 些 合并 和 并 购 现象 就 能 明显 
看 出 这 一 点 ， 其 结果 是 市 场 上 仅 有 少量 巨头 存活 。 遗 憾 的 是 ， 由 于 运营 的 私密 性 ， 现 
有 的 商业 CDN 提供 商 之 间 不 会 尝试 通过 合作 来 向 终端 用 户 分 发 内 容 。 除 此 之 外 ， 内 
容 提供 商 通常 只 同一 家 CDN 提供 商 合作 ， 这 就 无 法 同时 使 用 多 个 CDN。 这 种 封闭 和 
非 合 作 的 运营 模式 导致 CDN 提供 商 之 间 各 不 相同 。 因 此 ， 通 过 网 络 互联 使 不 同类 型 
的 CDN 在 进行 内 容 分 发 时 实现 协调 与 合作 ， 能 够 促进 CDN 提供 商 的 迅速 提升 ， 以 应 
对 瞬时 拥塞 ”和 需求 的 超 预 期 增长 ， 同 时 也 可 以 不 再 依赖 于 某 个 指定 的 CDN 提供 商 
来 提供 资源 。 

除了 大 型 企业 用 户 ，CDN 服务 对 其 他 用 户 的 价格 较为 昂贵 。 另 外 ， 商 业 CDN 38 
过 和 用 户 签订 服务 水 平 协议 (SLA) 来 做 出 服务 承诺 ， 如 果 CDN 没有 履行 相关 服务 ， 
就 会 受到 一 定 的 处 罚 。 因 此 ， 如 果 某 个 CDN 提供 的 服务 质量 (QoS) 不 能 满足 终端 
用 户 的 需求 ， 那 么 它 就 有 可 能 因为 违反 SLA 而 需要 付出 一 定 的 罚金 。 从 提供 商 和 终 
端 用 户 的 成 本 效率 和 性 能 的 角度 来 说 ， 如 果 能 够 综合 使 用 其 他 CDN 未 被 使 用 的 设施 ， 
就 可 以 实现 规模 经 济 效 益 。 为 方便 本 章 的 讨论 ， 我们 将 多 个 CDN 之 间 的 互联 和 协作 
技术 用 术语 “多 CDN 对 等 组 合 ” 或 简单 的 “CDN 对 等 ”来 表示 ， 其 定义 为 : 

对 等 组 合 :“ CDN 之 间 的 对 等 组 合 是 由 一 组 自治 的 CDN {CDN,, CDN,, +, 
CDN,} 构成 ， 它 们 之 间 根 据 某 种 机 制 M 进行 合作 ， 该 机 制 为 多 CDN 合作 提供 实现 资 
源 共 享 的 相关 资源 和 设施 ， 以 确保 有 效 的 服务 分 发 。 每 个 CDN, 通 过 一 个 “管道 ”C， 
和 其 他 对 等 成 员 连 接 ， 该 管道 帮助 该 CDN 从 其 他 CDN 中 找到 对 自己 有 用 的 资源 。 

虽然 CDN 对 等 的 设想 非常 具有 吸引 力 ， 但 具体 实现 起 来 仍然 需要 解决 很 多 问题 。 
例如 ， 需 要 设计 一 个 系统 ， 不 仅 可 以 虚拟 多 个 CDN 提供 商 ， 而 且 能 够 根据 成 本 、 人 性 
能 和 负载 的 情况 将 终端 用 户 的 请 求 从 主 提供 商 转移 到 其 对 等 成 员 。 特 别 地 ， 需 要 考虑 
如 下 关键 问题 : 

(1) 什么 时 候 对 等 ? 

也 就 是 说 ， 一 个 对 等 组 合 在 什么 条 件 下 应 该 被 激活 。 启 动 条 件 必 须 考虑 到 预期 和 
非 预期 的 负载 增长 。 

(2) 如 何 对 等 ? 

也 就 是 在 多 个 CDN 之 间 形 成 对 等 组 合 所 需要 的 规划 (strategy) 。 该 规划 必须 指定 
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实体 之 间 的 交互 ， 并 顾及 到 各 对 等 成 员 采 取 的 不 同 策略 (policy) 。 

(3) 和 谁 对 等 ? 

也 就 是 用 于 选择 与 哪个 CDN 建立 对 等 的 决策 机 制 。 它 涉及 如 何 对 对 等 成 员 性 能 
进行 预测 ， 以 及 如 何在 面临 独立 管理 和 与 对 等 CDN 共享 有 限 信 息 这 两 个 问题 下 进行 
工作 。 

(4) 如 何 管理 和 执行 对 策 ? 

也 就 是 如 何 根据 协商 的 SLA 来 管理 对 策 ， 包 括 配 置 必要 的 对 策 以 及 有 效 地 管理 
这 些 对 策 。 

因此 ， 对 于 一 个 Ad - Hoc 或 设计 中 的 对 等 CDN， 需 要 进行 大 量 基础 研究 来 解决 
如 下 几 个 核心 问题 : 测量 和 传播 负载 信息 、 执 行 请 求 的 分 配 和 重 定向 、 启 用 内 容 复 制 
以 及 对 分 布 于 整个 互联 网 尺度 上 的 参与 者 给 予 合适 的 补偿 。 此 外 ,为 了 确保 CDN 提 
供 商 之 间 不 间断 的 资源 共享 ， 对 等 组 合 必须 保证 能 为 所 有 参与 者 提供 足够 的 激励 。 
对 于 每 一 个 CDN 来 说 ， 这 些 问题 之 间 存 在 着 很 强 的 关联 性 和 依赖 性 ， 所 以 现在 必须 
在 一 种 协作 和 相互 作用 的 方式 下 看 待 它们 ， 同 时 满足 施加 在 每 个 提供 商 上 的 复杂 的 多 
维 约束 。 在 接受 其 客户 (customer) 的 委托 代为 向 终端 用 户 提供 内 容 服 务 时 ， 每 个 CDN 
提供 商 必须 保证 达到 SLA 的 要 求 ， 同 时 还 要 履行 与 其 他 提供 商 约定 好 的 相关 义务 。 

本 章 提出 了 一 种 实现 CDN 对 等 的 方法 ， 用 于 构建 一 个 “开放 的 ”CDN， 其 优点 
是 扩展 性 好 ， 可 以 与 其 他 CDN 共享 资源 ， 因 此 它 是 目前 已 有 的 非 协 作 CDN 的 升级 版 
本 。 在 我 们 的 架构 中 ， 只 要 一 个 CDN 的 处 理 能 力 可 以 应 对 当前 负载 ， 那 么 它 就 向 终 
端 用 户 的 请 求 提 供 服 务 。 如 果 负 载 超过 了 其 能 力 范围 ， 那 么 处 理 能 力 之 外 的 用 户 请 求 
就 会 被 转移 到 对 等 的 CDN。 同 时 ， 我 们 提出 了 两 个 新 的 模型 来 支持 CDN 对 等 ， 并 解 
决 实现 这 些 模型 所 需 面 对 的 问题 。 

本 章 其 余 内 容 组 织 如 下 : 16.2 节 描 述 了 CDN 对 等 的 意义 和 必要 性 ; 随后 介绍 了 
相关 的 研究 ， 并 着 重 说 明 它们 的 优 缺 点 ; 16.4 节 提 出 了 我 们 的 CDN 对 等 方法 及 一 些 
实现 辅助 功能 的 新 模型 ; 然后 ， 讨 论 了 实现 CDN 对 等 时 面临 的 挑战 ; 16.7 节 中 讨论 
了 需 解 决 的 核心 技术 问题 ; 最 后 ，16. 8 节 给 出 了 本 章 的 总 结 。 


16.2 CDN 网 络 互联 的 重要 性 


前 面 几 章 已 经 提 到 过 ， 由 于 用 户 请 求 的 数量 巨大 ， 访 问 量 大 的 网 站 通常 会 出 现 拥 
塞 、 瓶 颈 甚至 长 时 间 终 止 服务 的 情况 。 正 如 在 第 11 章 讨论 的 那样 ， 当 突 发 的 瞬时 拥 
塞 出 现时 就 会 导致 这 种 情况 的 发 生 。 瞬 时 拥塞 源 于 极其 重大 的 、 令 人 感 兴趣 的 事件 ， 或 
者 当 浏 览 像 Slashdot 或 Digg? 这 样 的 高 访问 量 、 高 热门 网 站 后 导致 的 流量 的 突然 攀升 。 

Web 服务 器 访问 量 的 增长 也 可 以 具有 更 高 的 可 预测 性 ， 如 在 奥运 会 和 FIFA 世界 
杯 比赛 期 间 。 使 用 单一 的 网 站 甚至 服务 器 集群 都 常常 不 能 适应 高 访问 量 网 站 的 请 求 规 
模 。 例 如 ，1998 年 足球 世界 杯 的 官方 网 站 在 3 个 月 内 收 到 的 请 求 数 达 到 了 13.5 亿 ， 
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其 中 请 求 数 的 峰值 达 7300 万 个 /天 以 及 1200 万 个 /hl 。1998 年 冬季 奥运 会 同样 也 出 
现 了 这 种 情况 ， 在 峰值 那天 官方 网 站 处 理 了 5680 万 个 请 求 (最 大 请 求 量 达 到 每 分 钟 
110414 ^)" , 2001 4E£9 A 11 A, 许多 主流 新 闻 网 站 服务 器 的 可 用 性 几乎 为 0， 完 
全 加 载 一 个 页 面 需要 45s 以 上 "” 。 即 使 终端 用 户 在 终止 访问 前 愿意 等 待 的 时 间 小 到 
仅仅 10s， 也 将 会 导致 额外 的 宽带 和 资源 浪费 。 

对 等 CDN 也 许可 以 成 为 一 个 好 的 办 法 来 解决 瞬时 拥塞 、Web 资源 过 度 配置 和 不 
利 情况 的 影响 。 很 明显 ， 如 果 存 在 一 个 框架 ， 它 能 够 在 CDN 之 间 实 现 对 等 ， 并 使 服 
务 器 负载 以 协作 的 方式 进行 共享 ， 那么 成 本 效益 、 性 能 、 可 扩展 性 和 服务 覆盖 范围 都 
将 得 到 显著 的 提高 。 为 了 更 好 地 理解 CDN 对 等 ， 先 以 图 16. 1 中 显示 的 情况 为 例 。 


itis 
的 边缘 服 
器 得 到 服 





图 16.1 一 个 CDN 对 等 
a) CDN 提供 商 通过 放置 一 个 新 的 POP 进行 扩展 b) CDN 提供 商 之 间 的 对 等 
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假设 要 在 加 勒 比 海 举办 ICC 板 球 世 界 杯赛 ， 提 供 直播 报道 的 网 站 为 www. cricinfo. com, 
这 个 网 站 作为 一 个 内 容 提供 商 ， 与 CDN 提供 商 Akamai'" 之 间 专 门 签订 了 一 个 SLA 协 
议 。 大 部 分 的 比赛 要 在 特 立 尼 达 和 多 巴 哥 岛 〈 一 个 加 勒 比 海岛 ) 举行 , 但 Akamai 在 
这 里 并 没有 接 人 点 (POP) 。 

作为 板 球 比赛 的 东道 主 ， 当 地 人 无 疑 会 对 www. cricinfo. com 提供 的 现场 直播 抱 有 
极 大 的 兴趣 。 假 设 Akamai 事先 已 预料 到 了 这 种 状况 ， 那 么 Akamai 的 管理 人 员 可 以 采 
取 必 要 的 措施 来 应 对 各 种 突 发 情况 。 为 了 给 用 户 提 供 更 好 的 服务 ，Akamai 有 两 种 选 
择 : 可 以 在 特 立 尼 达 和 多 巴 哥 群 岛 设立 代理 缓存 服务 器 (surrogate), BA ATLA LE 
用 距离 这 里 较 远 的 其 他 边缘 服务 器 ， 如 图 16. 1a 所 示 。 然 而 必须 指出 ， 首 先 ， 仅 仅 为 
了 一 个 特定 的 事件 而 设立 新 的 代理 缓存 服务 器 将 带 来 极 高 的 成 本 ,并 且 事 件 结束 后 这 
个 服务 器 可 能 就 没 用 了 ; 其 次 ， 如 果 不 能 为 用 户 请 求 提供 承诺 的 QoS, ABA Akamai 
的 声誉 就 会 面临 风险 ， 同 时 也 会 违背 SLA 并 造成 利润 的 降低 。 因 此 ，Akamai 可 以 与 
其 他 CDN 提供 商 合作 ， 形 成 对 等 组 合 来 分 发 那些 它 无 法 分 发 的 服务 ， 如 图 16. 1b 
所 示 。 

CDN 之 间 的 对 等 组 合 可 能 在 目的 、 范 围 、 规 模 和 持续 时 间 等 方面 都 存在 差异 。 
我 们 预计 ， 在 瞬时 拥塞 的 情况 下 ， 这 样 的 对 等 组 合 应 该 能 够 在 一 个 时 间 上 限 内 自动 做 
出 反应 。 毕 竟 ， 单 任 人 工 决 策 根本 无 法 快速 应 对 多 变 的 情况 。 对 于 长 期 事件 ( 见 图 
16. 1) ， 我 们 希望 将 人 工 决 策 包含 进来 ， 这 样 才能 保证 由 此 产生 的 任何 决策 能 够 顺应 
企业 的 战略 目标 。 


16.3 相关 工作 


资源 提供 商 的 网 络 互联 越 来 越 受 到 研究 者 的 重视 。 例 如 ，InterGrid" 描述 了 网 络 
互联 的 架构 、 机 制 和 原则 ， 以 便 网 格 能 够 以 类 似 互联 网 一 样 的 方式 进行 扩展 。 然 而 ， 
对 先前 研究 成 果 的 分 析 表 明 ， 对 等 的 框架 和 策略 等 方面 并 没有 取得 很 大 的 进展 ， 从 
CDN 的 角度 来 看 ， 造 成 进展 缓慢 的 原因 有 很 多 ， 包 括 需 要 解决 的 技术 问题 以 及 CDN 
自身 的 法 律 和 商业 运作 问题 等 。 对 于 对 等 CDN 而 言 ， 需 要 一 个 共同 的 协议 来 定义 交 
互 的 技术 细节 ， 以 及 对 等 关系 建立 期 间 的 存续 期 和 QoS。 此 外 ， 通 常 还 存在 烦琐 的 法 
律 条 款 (禁止 发 布 和 受 版 权 保护 的 内 容 ) 阻碍 CDN 之 间 的 自由 合作 。 最 后 ， 对 于 
Akamai 这 种 拥有 巨大 竞争 优势 的 CDN 提供 商 ， 其 网 络 的 地 域 覆 盖 范 围 比 任何 其 他 商 
Ay CDN 提供 商都 要 大 的 多 ， 所 以 简直 没有 任何 令 人 信服 的 商业 理由 来 让 这 种 提供 商 
加 入 CDN 对 等 。 l 
”互联 网 工程 任务 组 (ETF) 制定 的 新 的 互联 网 草案 提出 了 内 容 分 发 互联 (CDI) 
模型 ”， 该 模型 允许 CDN 将 其 分 发 设施 连接 到 其 他 有 内 容 要 分 发 的 CDN 上。 根据 
CDI 模型 ， 每 个 内 容 网 络 都 把 与 其 相 邻 的 内 容 网 络 看 做 黑 盒 ， 黑 盒 之 间 使 用 常规 协议 
进行 内 容 的 网 络 互联 ， 而 在 黑 盒 内 部 则 使 用 自己 专 有 的 协议 。 因 此 ， 互 联 的 CDN 仍 
能 隐藏 各 自 的 细节 部 分 。CDI 互联 网 草案 提出 了 CDN 之 间 的 互联 ， 但 是 并 没有 清楚 
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地 解释 这 种 互联 如 何 建立 ， 以 及 互联 之 间 的 关系 特性 。 

CDI 的 一 种 协议 架构 "" 试图 实现 在 独立 管理 的 CDN 之 间 的 交互 和 合作 。 在 这 个 
框架 中 ， 一 个 处 于 管理 角色 的 CDN (相对 于 某 一 个 特定 的 组 而 言 ) 在 转发 请 求 之 前 ， 
会 在 CDN 之 间 交 换 性 能 数据 ， 这 在 客户 端 响应 时 间 上 增加 了 一 个 额外 的 开销 。 此 外 ， 
作为 端 对 端 协议 ， 如 果 一 个 端点 停止 服务 ， 那 么 在 它 恢 复工 作 之 前 连接 将 一 直 是 中 断 
的 。 由 于 不 存在 对 性 能 数据 交换 的 评价 机 制 ， 所 以 该 协议 的 有 效 性 目前 还 不 清楚 。 

CDN 中 介 (CDN brokering) 允许 一 个 CDN 将 终端 用 户 动态 、 智 能 地 重 定向 到 
域 中 的 其 他 CDN。 这 种 基于 DNS 的 系统 叫做 智能 域名 服务 器 (IDNS ) 。 该 系统 存在 
的 缺点 是 其 机 制 在 本 质 上 是 专 有 的 ， 因 此 它 可 能 不 适用 于 通用 的 CDI 架构 。 尽 管 它 能 
带 来 更 高 的 CDN 容量 、 更 低 的 成 本 以 及 更 好 的 容错 能 力 ， 但 在 处 理 请 求 时 并 没有 明 
显 地 顾及 到 终端 用 户 的 QoS 体验 。 此 外 ，IDNS 看 起 来 更 像 是 证 明了 中 介 概 念 的 可 行 
性 ， 而 不 是 对 一 个 特定 CDN 的 性 能 进行 综合 评价 。 

针对 多 提供 商 架 构 中 的 内 容 分 发 载荷 问题 ，Amini 等 人 "给 出 了 一 个 对 等 系统 。 
该 系统 的 核心 部 分 是 一 个 对 等 算法 ， 该 算法 将 用 户 请 求 重 定向 到 其 他 提供 商 ， 以 实现 
成 本 的 最 小 化 和 提高 性 能 。 然 而 ，Amini 等 人 并 没有 对 提供 商 之 间 的 对 等 策略 、 资 源 
配置 和 QoS 担保 等 方面 进行 研究 。 

从 用 户 的 角度 来 看 ， 协 作 联 网 (CoopNet)" 可 以 使 终端 用 户 之 间 实 现 合 作 ， 由 
此 带 来 了 网 络 性 能 的 改善 。 一 旦 发 生 瞬 时 拥塞 ,就 可 以 启动 这 种 用 户 之 间 的 协作 。 我 
们 发 现 ，CoopNet 对 资源 有 限 的 小 型 网 站 比较 有 效 。 但 是 ， 这 种 基于 用 户 端 的 机 制 存 
在 的 最 大 问题 是 它们 对 于 用 户 来 说 是 不 透明 的 ， 这 可 能 会 使 其 无 法 得 到 广泛 使 用 ， 因 
而 无 法 取代 基于 架构 的 CDN 之 间 的 合作 方式 。 

CoDeeNC 提供 的 内 容 分 发 服务 完全 由 终端 用 户 的 需求 驱动 。 然 而 ， 使 用 
CoDeeN 服务 时 对 终端 用 户 也 是 不 透明 的 ， 因 为 这 时 需要 用 户 亲自 使 用 手动 方式 在 浏 
览 器 的 代理 选项 中 进行 设置 后 才能 够 与 CoDeeN 实现 交互 。 这 种 由 用 户 驱 动 的 方式 意 
味 着 CoDeeN 在 本 质 上 只 是 一 种 精巧 的 缓存 机 制 ， 而 不 是 一 个 真正 的 CDN。 作 者 也 曾 
注意 到 该 系统 很 可 能 会 被 带宽 占用 (bandwidth hog)、 密 码 破 解 和 授权 内 容 盗窃 等 恶 
意 行为 所 滥用 ， 这 就 需要 CoDeeN 具备 一 些 基 本 的 保护 措施 ， 如 IP 黑 名 单 、 本 地 与 外 
部 用 户 的 权限 分 离 等 。 目 前 ，CoDeeN 只 运行 于 PlanetLab 上 的 节点 ， 其 作者 也 在 设想 
与 外 部 的 内 容 提供 商 合 作 ， 但 目前 仍 尚未 实现 。 

CoralCDN'") 提出 了 一 种 新 的 P2P DNS 方法 ， 可 以 将 用 户 转 到 CoralCDN 覆盖 网 中 
的 副本 节点 ， 从 而 降低 源 服务 器 的 压力 并 提高 用 户 的 性 能 体验 。CoralCDN 是 一 个 协 
作 网 络 ， 但 是 没有 提供 任何 手段 来 使 新 的 节点 (或 者 提供 商 ) 加 入 其 对 等 网 ， 也 不 
支持 与 PlanetLab 外 的 节点 实现 网 络 互 联 。 而 目前 网 内 的 已 有 节点 也 仅仅 使 用 了 一 个 
比较 粗略 的 控制 方法 〈 如 允许 单个 服务 器 指定 其 最 大 峰值 和 稳 态 带宽 使 用 量 ) ， 不 仅 
没有 给 节点 提供 精细 粒度 的 控制 策略 〈 例 如 一 个 节点 为 哪些 内 容 提 供 服 务 ) ， 也 没有 
任何 对 服务 质量 的 担保 。 当 然 ， 考 虑 到 该 服务 是 免费 且 面 向 研究 的 ， 这 种 状况 就 可 以 
理解 了 。 该 服务 基于 “尽力 而 为 ”的 机 制 提 供 内 容 服务 ， 且 没有 给 参与 协作 的 节点 
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任何 补偿 。 

Globule'? 7! f& —4-JFURESUMESK CDN， 它 允许 几乎 任何 一 台 托管 Web 内 容 的 服 
务 器 在 安装 定制 化 Globule Apache 软件 后 加 入 对 等 ， 之 所 以 选择 Apache 是 因为 它 是 
一 个 被 广泛 应 用 的 主流 Web 服务 器 平台 。Globule 能 够 实现 服务 器 之 间 的 对 等 、Ad - 
Hoc 选择 、 副 本 的 创建 和 销毁 、 副 本 的 一 致 性 管理 以 及 将 客户 端 相对 透明 地 重 定向 
(通过 HTTP 或 者 DNS) 到 高 性 能 副本 。Globule CDN 中 参与 对 等 的 服务 器 既 可 以 是 
托管 服务 器 也 可 以 是 被 托管 服务 器 ， 或 两 者 均 可 。 这 意味 着 除了 能 为 它们 自己 的 站 点 
和 其 他 用 户 站 点 提供 内 容 服 务 外 ， 它 们 还 能 够 通过 平衡 其 他 参与 者 的 资源 来 复制 自己 
的 站 点 。 带 宽 和 资源 的 约束 可 以 应 用 到 被 托管 服务 器 ， 但 是 这 并 不 是 由 Globule 自己 
来 处 理 的 ， 而 是 要 依靠 托管 服务 器 中 可 用 的 相应 设施 来 强化 这 个 约束 (如 利用 可 限 
定 带 宽 的 Apache 模块 和 “监管 ”环境 来 限制 资源 使 用 ) 。 参 与 者 可 以 使 用 Globule 提 
供 的 一 个 代理 服务 来 注册 和 访问 其 他 参与 者 的 资源 ， 以 便 启动 针对 托管 请 求 的 协商 。 
这 些 协 商 包 括 定价 和 补偿 协议 ， 但 在 Globule 中 这 些 问 题 并 没有 得 到 深入 研究 。Glob- 
ule CDN 也 考虑 到 了 安全 性 和 数据 完整 性 问题 〈《 如 对 恶意 用 户 的 相关 处 理 ) ， 但 实现 
的 还 远 远 不 够 。 

DotSlash' 是 一 个 基于 社区 的 “互助 ”服务 ， 可 以 帮助 一 些 没有 足够 资源 的 小 型 
站 点 应 对 瞬时 拥塞 问题 。 只 要 存在 这 种 问题 的 站 点 通过 一 定 的 配置 接 人 DotSlash， 那 
么 当 瞬 时 拥塞 发 生 时 该 服务 就 能 自动 地 干预 : 根据 负载 的 情况 分 配 和 释放 服务 器 ， 并 
在 瞬时 拥塞 消失 后 停止 救援 。 参 与 者 可 以 使 用 服务 目录 来 方便 地 实现 相互 定位 。 
DotSlash 中 的 参与 者 有 三 种 固定 和 互 斥 的 状态 : SOS 状态 、 救 援 状态 和 正常 状态 。 
SOS 状态 表示 该 参与 者 目前 过 载 ， 并 从 其 他 参与 者 那里 接受 救援 ; 救援 状态 表示 该 参 
与 者 正在 向 那些 处 于 SOS 状态 的 参与 者 提供 救援 。 由 于 DotSlash 的 本 质 是 基于 社区 驱 
动 ， 所 以 没有 向 互联 节点 提供 任何 设施 来 接受 参与 对 等 组 合 的 补偿 (无 论 资金 类 还 
是 资源 类 ) 。 


16.4 CDN 网 络 互联 /对 等 的 架构 


不 同 CDN 之 间 的 网 络 互 联 仍 然 是 一 个 远 未 解决 的 问题 。 通 过 对 等 机 制 进行 CDN 
网 络 互联 的 概念 具有 很 大 的 吸引 力 ， 人 们 希望 通过 对 其 研究 ， 可 以 解决 突 发 的 瞬时 拥 
塞 问题 ， 以 及 对 短期 或 长 期 的 网 络 请 求 增长 进行 预测 ， 尤 其 是 当 单个 CDN 的 资源 较 
为 匮乏 时 。 通 过 形成 对 等 组 合 ， 那 些 在 某 个 特定 地 区 不 具备 资源 的 CDN 就 可 以 利用 
其 他 CDN 的 资源 ， 解 决 内 容 需 求 增 长 的 局 部 性 问题 。 然 而 ， 正 如 16. 3 节 所 述 ， 目 前 
协作 式 CDN 虽然 很 多 ， 但 其 运行 却 相互 独立 ， 并 且 不 同 的 商业 CDN 都 是 依据 不 同 的 决 
策 、 方 法 和 QoS 水 平 来 运营 。 因 此 ， 为 了 使 这 些 相互 独立 的 CDN 实现 对 等 ， 我 们 需要 
对 对 等 进行 规范 化 ， 包 括 对 等 方式 、 如 何 相互 作用 以 及 如 何 设 置 和 管理 QoS 水 平 。 

在 之 前 的 工作 中 “" ， 我 们 已 经 提出 了 一 个 由 策略 驱动 的 对 等 CDN 框架 ( 见 图 
16.2)。 表 16. 1 中 列 出 了 用 来 描述 这 个 系统 架构 的 术语 。 对 等 协商 的 发 起 者 称 为 主 
CDN， 其 他 同意 提供 资源 的 CDN 称 为 对 等 CDN。 两 个 CDN 之 间 对 等 协商 的 目标 称 为 
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合约 (SLA)， 它 标识 出 那些 被 分 配 的 用 于 为 主 CDN 提供 内 容 服务 的 对 等 资源 (Web 
服务 器 、 带 宽 等 ) 。 主 CDN 管理 它 所 得 到 的 资源 ， 并 决定 多 大 比例 的 Web 流量 (BU 
终端 用 户 请 求 ) 被 重 定向 到 对 等 CDN 的 Web 服务 器 。 

图 16.3 列 出 了 创建 一 个 对 等 组 合 的 主要 步骤 。 我 们 将 这 些 步骤 总 结 如 下 : 

1) 对 等 组 合 的 创建 开始 于 主 CDN 提供 商 意识 到 它 无 法 处 理 其 Web 服务 器 中 的 
一 部 分 工作 负载 ， 此 时 主 CDN 向 调解 器 (mediator) 发 送 一 个 启动 请 求 。 






Web 服 务 主机 5 
(Bl: Apache) | NS 
策略 代理 | NU. AN 
基于 SLA 的 分 配器 Tw 






图 16.2 帮助 创建 对 等 CDN 的 系统 架构 
表 16.1 常用 术语 


R OB d x 
Web 服务 器 (WS) 一 个 内 容 的 存储 器 
调解 器 一 个 由 策略 驱动 的 实体 ， 被 授权 进行 策略 的 协商 和 管理 
服务 注册 表 (SR) 在 本 地 域内 搜索 和 存储 资源 和 策略 信息 
对 等 代理 (PA) 对 等 CDN 环境 中 的 一 个 资源 搜索 模块 
策略 库 (PR) Web 服务 器 、 调 解 器 和 对 等 策略 的 存储 空间 
Pws 用 于 内 容 存储 和 管理 的 ， 与 特定 Web 服务 器 相关 的 规则 集 
Py 用 于 交互 和 协商 的 ， 与 特定 调解 器 相关 的 规则 集 
Ppocring 用 于 创建 和 发 展 对 等 组 合 的 规则 集 


2) 调解 器 实例 从 服务 注册 表 获 得 资源 和 访问 信息 ， 从 策略 库 得 到 SLA 及 其 他 


策略 。 
3) REE CDN 的 调解 器 实例 根据 当前 状况 和 客户 的 SLA 需求 ， 产 生 服 务 需求 ， 


因此 它 需 要 进行 扩充 ， 以 包含 来 自 其 他 CDN 的 额外 资源 。 
4) 调解 器 实例 将 服务 需求 传递 给 本 地 的 对 等 代理 (PA)。 如 果 当 前 有 对 等 组 合 
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存在 (对 于 长 期 方案 ) ， 那 么 立刻 将 其 返回 给 主 CDN; AM, 5j PA 指定 的 对 等 CDN 
进行 短期 协商 。 

5) 当主 CDN 从 对 等 处 获得 足够 的 能 满足 客户 SLA 需求 的 资源 时 ， 新 的 对 等 组 
合 就 开始 运作 。 如 果 没 有 CDN 对 建立 对 等 感 兴趣 ， 那 么 算法 转 回 到 第 3 步 ， 重 新 确 
定 服 务 需 求 ， 通 过 重新 协商 来 创建 对 等 组 合 。 

如 果 以 下 情况 发 生 ， 那 么 现存 的 对 等 组 合 可 能 需要 解散 或 者 重新 建立 : 中 形成 对 
等 的 条 件 不 再 存在 ; 对 等 不 再 对 参与 的 各 CDN 有 益 ; @@ 一 个 现存 的 对 等 组 合 需要 
进一步 扩展 来 处 理 额 外 的 负载 ;，@@ 参 与 的 各 CDN 没有 履行 自己 承诺 的 贡献 。 







« 3) 为 资源 协调 确定 让 EN xoà 
服务 需求 和 策略 - 请 求 





a 
请 求 资源 


图 16.3 创建 一 个 对 等 组 合 的 典型 步骤 

我 们 选择 基于 IETF 策略 的 框架 ， 以 便 实 施 、 管 理 和 控制 对 网 络 资源 的 访问 。 
尽管 这 种 框架 已 初步 用 于 单个 的 CDN, 但 目前 尚未 在 多 个 对 等 的 CDN 中 得 到 应 
用 "“!。 策 略 框架 由 四 个 基本 元 素 构 成 : 策略 管理 、 策 略 库 、 策 略 实施 点 (PEP) 以 
及 策略 决策 点 (PDP), 

在 标准 的 IETF 策略 框架 中 ， 管 理 域 是 指 一 个 在 系统 边界 内 实施 、 管 理 和 控制 访 
问 资源 的 实体 。 管 理 员 使 用 策略 管理 工具 来 定义 系统 中 要 实施 的 策略 。PEP 是 系统 边 
界 内 的 逻辑 实体 ， 负 责 执行 被 定义 的 策略 ， 执 行 结果 对 系统 本 身 有 直接 影响 。PEP 需 
要 遵循 的 策略 存储 在 策略 库 中 ， 管 理 员 使 用 策略 管理 工具 产生 这 些 策 略 。PDP 负责 从 
策略 库 中 检索 策略 、 解 释 策略 (基于 策略 条 件 ) 以 及 决定 PEP 要 执行 哪个 策略 (BU 
策略 规则 ) 。 如 何 将 这 些 逻 辑 元 素 配置 在 CDN 系统 中 的 恰当 位 置 ， 显 然 对 相关 CDN 
和 终端 用 户 所 体验 到 的 功能 和 性 能 会 产生 巨大 的 影响 ， 因 此 需要 根据 其 所 在 的 特定 
CDN 平台 ， 认 真 地 加 以 考虑 。 

在 对 等 CDN 中 ， 策 略 可 以 是 对 等 CDN 中 的 参与 者 共同 认可 的 那些 共识 。 这 些 共 
识 定义 了 什么 类 型 的 内 容 和 服务 可 以 发 布 到 CDN 节点 、 参 与 者 之 间 可 以 共享 什么 资 
源 、 采 取 什 么 指标 来 确保 基于 SLA 的 QoS， 以 及 在 源 服务 器 处 必须 执行 什么 类 型 的 程 
序 和 数据 。 

本 节 提 出 的 对 等 CDN 模型 如 图 16.2 所 示 ， 它 被 映射 到 IETF 策略 框架 ， 见 表 
16. 2。 策 略 库 负责 存储 由 对 等 组 管理 员 使 用 策略 管理 工具 产生 的 策略 ， 一 个 典型 的 例 
子 是 用 于 建 组 的 “发 起 者 ”策略 。 策 略 库 对 Web 服务 器 、 调 解 器 和 对 等 策略 进行 虚 
拟 化 ， 这 些 策略 也 是 由 策略 管理 工具 产生 的 。 分 发 网 和 Web 服务 器 组 件 ( 即 Web Bi 
务 主机 、 策 略 代 理 、 基 于 SLA 的 分 配器 ) 是 PEP 的 实例 ， 负 责 执行 存储 在 策略 库 中 
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的 对 等 CDN 策略 。 对 等 代理 和 调解 器 是 PDP 的 实例 ， 它 们 指定 了 在 与 其 他 CDN 协作 
时 需要 协商 的 一 系列 策略 ， 这 些 策略 在 协商 时 将 传 给 对 等 代理 。 策 略 管理 工具 由 管理 
员 负责 ， 随 CDN 平台 的 不 同 而 有 所 区 别 。 使 用 这 种 基于 策略 的 架构 ， 其 直接 的 好 处 
是 能 够 通过 一 个 共同 的 对 等 框架 促进 CDN 之 间 的 协作 能 力 ， 最 终 降 低 CDN 的 运营 成 
本 ,使 CDN 在 超 负载 条 件 下 仍 可 以 满足 终端 用 户 的 QoS 需求 。 


表 16.2 策略 映射 


策略 框架 组 件 特定 策略 RES 
系统 系统 中 所 有 策略 ”| ”分 布 式 计算 和 网 络 架构 (用 于 对 等 CDN) 
m 经 过 协调 的 对 等 策略 | ”一 个 用 于 资源 管理 和 访问 控制 的 管理 实体 


策略 管理 工具 | ”与 管理 员 有 关 。 | — | 一 个 管理 员 相关 的 工具 ， 用 于 产生 策略 


Web 服务 器 对 等 
Web 服务 主机 、 
策略 增强 点 | 策略 代理 、 基 于 Web 服务 器 策略 一 个 逻辑 实体 ， 确 保 对 策略 的 恰当 增强 


SLA 的 分 配器 


调解 器 策略 = 


我 们 提出 了 基于 排队 论 原理 的 性 能 模型 ， 以 验证 CDN 之 间 对 等 的 效果 ， 并 描述 
一 个 CDN 的 QoS 性 能 特性 。 

设 终端 用 户 的 个 独立 的 请 求 流 到 达 一 个 称 为 分 派 器 (dispatcher) 的 概念 实体 ， 
它们 服从 平均 到 达 率 为 A (ie. 11, 2,…，N|) 的 泊 松 过 程 。 分派 器 在 一 个 特定 的 
对 等 关系 中 起 到 一 个 集中 调度 器 的 作用 ， 它 采用 独立 机 制 ， 以 对 用 户 透明 的 方式 在 相 
关 CDN 之 间 分 发 内 容 请 求 。 如 果 被 接收 到 的 用 户 请 求 不 能 被 CDN, IRS, 那么 该 CDN 
将 这 个 请 求 重 定向 到 其 对 等 的 CDN 处 。 由 于 这 种 分 派 是 作用 于 Web 内 容 的 个 别 请 求 
上 ， 因 此 它 的 控制 级 别 能 够 达到 精细 的 粒度 。 分 派 器 遵循 某 个 特定 的 策略 来 将 部 分 请 
RA CDN, 分 配 到 CDN, 。 

在 实验 部 分 , 我 们 考虑 了 一 个 已 经 建立 的 由 三 个 CDN 组 成 的 对 等 组 合 。 假 设 
CDN Web 服务 器 的 总 处 理 能 力 是 累加 的 ， 并 且 每 个 对 等 都 包含 了 相同 的 内 容 副本 。 
每 个 CDN 处 理 能 力 的 服务 时 间 服 从 一 般 分 布 。 此 处 利用 术语 “任务 ”来 表示 广义 的 
到 达 服 务 请 求 。 我 们 将 一 个 到 达 的 请 求 处 理 需求 情况 定义 为 “任务 大 小 ”。 每 个 CDN 
被 建 模 为 一 个 随 着 任务 大 小 变化 而 高 度 变化 的 超 指数 分 布 的 M/G/1 队列 ， 该 分 布 近 
似 于 一 个 长 尾 有 界 的 Pareto 服务 分 布 (a，k，p)。 因 此 ， 工 作 负载 模型 结合 了 网 络 访 
问 的 高 变化 性 和 自 相似 性 的 特点 。 

在 我 们 的 性 能 模型 中 ， 参 与 的 内 容 提供 商 根据 非 抢 占 排头 (HOL) 优先 级 排队 
系统 进行 组 合 提 供 。HOL 是 一 个 M/G/1 排队 系统 ， 假 设 用 户 的 优先 级 在 它们 到 达 
CDN 时 已 知 ， 这 样 它 们 能 够 立刻 以 有 序 的 方式 进入 队列 。 因 此 ， 根 据 已 知 的 优先 级 
关系 可 以 区 分 不 同 服务 和 请 求 的 各 种 优先 级 。 在 我 们 的 模型 中 ， 一 个 输入 请 求 〔 优 
先 级 为 p) 加 入 队列 内 ， 其 前 面 是 所 有 优先 级 小 于 等 于 p 的 用 户 请 求 ， 其 后 是 那些 优 
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先 级 大 于 p 的 用 户 请 求 。 由 于 CDN 模型 的 这 种 性 质 ， 对 等 的 效果 不 会 受到 特定 的 请 
求 重 定向 策略 的 影响 。 

实验 中 ， 我 们 认为 平均 等 待 时 间 是 评估 CDN 性 能 的 一 个 重要 参数 。 平 均等 待 时 
间 对 应 于 用 户 请 求 被 CDN 服务 之 前 所 经 过 的 时 间 。 在 我 们 的 对 等 方案 中 也 假设 了 一 
个 SLA， 即 主 CDN 需要 在 不 超过 20000 个 时 间 单 位 内 服务 所 有 用 户 的 请 求 。 

1. = CDN 的 QoS 性 能 

首先 ， 我 们 提供 的 证 据 表 明 CDN 之 间 的 对 等 组 合 能 够 协助 主 CDN 向 用 户 提供 更 
好 的 QoS, E CDN 的 等 待 时 间 的 累积 分 布 函数 (CDF) 可 以 用 来 作为 QoS 性 能 指标 。 
在 对 等 CDN 这 样 一 个 处 于 高 度 变化 的 系统 中 ，CDF 的 值 明显 高 于 均值 。 

1.0 


1.0 









， - 兴 - 轻 度 负载 (2=0.6) 





(ool. —9— tH iE fA #R(0=0.7) 0.8 
， 一 一 重度 负载 (2=0.9) 
A * o6 
i i ES ; 
Re 0.4 r Au 
VJ > 轻 度 负载 (2 =0.6) 
028 /- 一 9 一 中 度 负 载 (? 70.7) 
A k 一 一 重度 负载 (2 -0.9) 
M^ 4000 8000 12000 16000 20000 d^ 4000 8000 12000 16000 20000 
等 待 时 间 ( 时 间 单 位 ) 等 待 时间 ( 时 间 单 位 ) 
a) b) 


图 16.4 X CDN 等 待 时 间 的 累积 分 布 
a) 没有 对 等 b) 处 于 对 等 组 合 中 


图 16. 4a 显示 了 主 CDN 在 未 对 等 情况 下 不 同 负载 对 应 的 等 待 时 间 的 CDF。 从 图 
中 可 以 看 出 ， 设 时 间 阔 值 为 20 000 个 时 间 单 位 ， 对 于 轻 度 负载 p =0.6， 用 户 等 待 时 
间 低 于 阔 值 的 概率 大 约 是 55% ; 对 于 中 度 负 载 p = 0.7， 该 概率 是 50% ; 而 对 于 重度 
负载 p =0.9， 该 概率 高 于 24% 。 

图 16.4b 显示 了 主 CDN 在 对 等 情况 下 不 同 负载 对 应 的 等 待 时 间 的 CDF。 通 过 比 
较 图 16. 4a 和 图 16. 4b 可 以 看 出 ， 对 于 轻 度 负载 p = 0.6， 用 户 等 待 时 间 低 于 阔 值 (K 
小 同上 ) 的 概率 大 约 是 80% 。 因 此 ， 在 我 们 的 方案 中 ， 通 过 对 等 的 帮助 ， 主 CDN 的 
QoS 性 能 提高 了 大 约 31% 。 对 于 中 度 负载 p = 0.7， 等 待 时 间 低 于 阅 值 的 概率 大 于 
81% ， 提 高 了 38% 。 对 于 重度 负载 p = 0.9， 概 率 大 约 是 70% ， 提 高 了 65%., 而且， 
对 于 p >0.9 的 负载 ， 相 信 性 能 模型 会 有 更 大 的 提高 。 基 于 这 些 观 察 ， 我 们 可 以 认为 ， 
在 不 考虑 任何 特定 的 重 定向 请 求 策略 的 情况 下 ， 相 比 于 非 对 等 情况 ，CDN 之 间 的 对 
等 策略 实现 了 QoS 性 能 的 大 幅度 提高 。 

2. 请 求 重 定 向 的 影响 

现在 来 研究 请 求 重 定向 策略 对 主 CDN 用 户 平均 等 待 时 间 的 影响 。 重 定向 策略 用 
来 决定 哪些 请 求 需要 重 定向 到 对 等 成 员 处 。 在 前 面 章节 中 已 经 为 对 等 CDN 模型 评估 
了 不 同 的 请 求 重 定向 策略 。 这 里 仅 需 要 给 出 在 所 有 的 对 等 CDN 中 使 用 均匀 负载 均衡 
(ULB) 的 请 求 重 定向 策略 时 的 性 能 结果 ， 也 就 是 说 ， 在 所 有 的 对 等 CDN 中 间 以 相同 
的 概率 对 重 定向 的 内 容 请 求 进行 分 配 。 我 们 的 目的 是 表明 ， 与 非 对 等 结果 相 比 ， 即 便 
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使 用 简单 的 请 求 重 定向 策略 ， 性 能 模型 也 能 对 平均 等 待 时 间 产 生 显著 的 改善 。 

实验 中 ， 假 设 直到 主 CDN 的 负载 达到 阔 值 时 〈p =0.5) 才 开始 使 用 重 定向 ， 这 
个 负载 值 也 用 做 负载 基准 来 比较 在 不 同 主 CDN 负载 时 的 等 待 时 间 。 超出 这 一 负载 的 
部 分 将 会 分 流 给 对 等 成 员 ， 每 个 对 等 成 员 只 准备 好 接收 重 定向 请 求 中 的 一 部 分 〈 按 
接收 国 值 计算 )。 到 达 特 定 对 等 成 员 的 重 定向 请 求 如 果 超 过 接收 阐 值 ， 则 被 丢弃 以 维 
持 系 统 的 平衡 。 我 们 考虑 轻 负载 的 对 等 (对 等 1 和 对 等 2 的 负载 分 别 设置 为 0.5 和 
0.4), ， 同 时 调节 主 CDN 的 负载 (0. 1<p <0.9)。 需 要 注意 ,为 了 得 到 请 求 重 定向 的 
效果 ， 我 们 给 出 的 是 等 待 时 间 的 加 权 平 均值 。 


100000 r 
—e— 重 定向 之 前 

80000 }--- 一 9 一 重 定向 之 后 : ULB 
一 一 基准 负载 ，2 =0.5 


40000 


等 待 时 间 (时 间 单 位 ) 


20000 | - ---~ 





0.1 0.3 0.5 0.7 0.9 
主 CDN 上 的 负载 


图 16.5 ”均匀 请 求 重 定向 策略 下 ， 请 求 重 定向 对 主 CDN 等 待 时 间 的 影响 


从 图 16. 5 中 发 现 ， 不 使 用 请 求 重 定向 时 ， 当 主 CDN 的 负载 达到 1. 0 时 ， 用 户 感 
知 的 主 CDN 服务 性 能 即 等 待 时 间 ) 趋 于 无 穷 大 。 另 外 ， 使 用 请 求 重 定向 之 后 ， 主 
CDN 的 等 待 时 间 降 低 了 ， 这 是 由 于 请 求 被 重 定向 到 对 等 成 员 处 。 从 图 中 可 以 看 出 ， 
对 于 轻 度 负载 p =0.6， 等 待 时间 减 少 了 43% ; 对 于 中 度 负载 p =0.7， 等 待 时 间 减 少 
T 669»; 对 于 重度 负载 p =0.9， 等 待 时 间 减 少 了 90% 以 上 。 从 结果 可 以 看 出 ， 即 使 
像 ULB 这 样 简单 的 请 求 重 定向 策略 也 能 保证 最 大 等 待 时 间 低 于 20000 个 时 间 单 位 
(按照 SLA) 。 因 此 ， 可 以 预测 ， 一 个 可 扩展 的 高 效 请 求 重 定向 策略 可 能 会 带 来 更 好 
的 性 能 。 我 们 的 结果 也 表明 ， 仅 重 定向 一 小 部 分 请 求 就 能 够 减轻 对 等 系统 中 的 不 稳定 
性 和 过 载 问题 ， 各 对 等 成 员 也 避免 了 被 突 发 的 请 求 拖 垮 。 


16.5 CDN 对 等 的 新 模型 


在 本 节 中 ， 我 们 提出 两 种 辅助 CDN 对 等 的 新 模型 ， 它 们 分 别 是 基于 中 介 的 模型 
和 由 QoS 驱动 (定制 的 ) 的 基于 中 介 的 模型 ， 可 用 于 完善 在 16.4 节 中 提出 的 对 等 
CDN 模型 。 为 了 更 好 地 理解 这 些 模型 的 独特 之 处 ， 并 将 它们 与 已 有 的 模型 做 对 比 ， 
首先 回顾 基于 P2P 的 传统 网 络 互联 /对 等 CDN 模型 ， 然 后 提出 我 们 的 用 于 形成 CDN 
对 等 的 新 设想 。 表 16. 3 对 已 有 CDN 模型 和 本 章 提出 的 CDN 模型 进行 了 对 比 ， 并 总 
结 了 它们 各 自 的 特点 。 
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表 16.3 CDN 模型 的 对 比 





























典型 的 CDN BUS 用 于 CDN 对 等 的 高 级 模型 
l 由 QoS 驱动 (定制 ) 
传统 CDN | 基于 P2P 的 CDN | 对 等 CDN 的 基于 中 介 
的 模型 
基于 Web 服 | ”基于 对 等 和 内 | 基于 CDN 网 | 基于 CDN 基于 用 户 定 
内 容 分 发 的 本 质 | 务 器 的 协作 | 。 容 的 可 用 性 | 络 互 连 /对 等 | ”的 性 能 | 义 的 QoS( 定 制 ) 
内 容 有 效 分 
CDN r 对 等 / CDN 容 提供 内 容 提 供 
thd 等 /用 户 g 内 容 提供 商 容 提供 商 
CDN 与 内 容 提 
CDN 与 内 容 | 没有 实际 的 协议 CDN 与 内 容 | CDN 与 内 容 
议 +R, CDN E 
协议 中 的 实体 | ug | 。( 自 利 的 用 户 ) ihe 了 | 提供 商 提供 商 
协议 的 本 质 N/A 短期 或 长 期 | ”基于 策略 动态 
扩展 性 有 限 高 高 高 高 
与 外 部 CDN 的 协 谷 。 否 否 是 是 是 
ia E 
CDN 之 间 的 协作 否 否 是 pose & CDN 并 行 工作 
用 户 之 间 的 协作 是 否 a 5 








16.5.1 已 有 的 CDN 模型 


在 传统 的 CDN 模型 中 ， 终 端 用户 从 特定 内 容 提供 商 的 Web 站 点 上 请 求 内 容 。 而 
实际 内 容 本 身 是 由 内 容 提供 商 租 用 的 CDN 提供 ， 这 些 CDN 从 距离 终端 用 户 最 近 的 边 
缘 服务 器 上 将 内 容 发 送 给 用 户 。 通 常 内容 提 供 商 和 CDN 提供 商 之 间 会 就 内 容 提供 商 
所 能 提供 给 终端 用 户 的 服务 标准 达成 协议 ， 包 括 保证 运行 时 间 、 平 均 延 时 以 及 其 他 参 
数 。 传 统 CDN 的 典型 例子 包括 Akamai、Limelight Networks 和 Mirror Image 等 。 它 们 是 
典型 的 单一 实体 ， 不 会 彼此 合作 来 发 布 内 容 和 履行 服务 义务 。 这 种 模式 更 适合 于 那些 
在 全 球 各 处 都 有 服务 设施 的 CDN 提供 商 ， 能 够 面向 大 多 数 用 户 来 配置 边缘 服务 器 ， 
并 拥有 足够 的 能 力 处 理 〈 由 瞬时 拥塞 造成 的 ) 峰值 负载 。 尽 管 CDN 之 间 没 有 合作 ， 
但 是 一 个 CDN 内 部 的 Web 服务 器 之 间 会 进行 合作 (协作 式 内 容 分 发 ) ， 以 保证 内 容 
按 需 复制 并 满足 所 有 的 SLA。 因 此 ， 高 效 内 容 分 发 的 责任 完全 落 在 单个 CDN 提供 商 
的 身上 。 

在 基于 P2P 的 CDN 中 ， 内 容 提供 商 利用 (全 部 使 用 或 者 仅仅 作为 传统 CDN 的 辅 
助 部 分 ) 端 用 户 节 点 来 及 时 有 效 地 分 发 内 容 ， 如 CoDeeN Coral 和 Globule。 前 两 者 作 
为 志愿 者 节点 被 部 署 在 PlanetLab 平台 上 ， 而 Globule 则 运行 在 终端 节点 上 。 CoopNet 
和 DotSlash 是 另外 的 两 个 例子 ，CoopNet 允许 终端 用 户 在 瞬时 拥塞 出 现时 通过 合作 来 
提高 用 户 的 性 能 体验 ，DotSlash 是 一 个 由 社区 驱动 的 互助 服务 ， 用 来 缓解 瞬时 拥塞 。 
在 这 种 CDN 中 ,终端 用 户 能 够 相互 协作 来 提高 所 有 用 户 的 性 能 体验 ， 尤其 是 在 同一 
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地 理 区 域 的 同一 边缘 服务 器 附近 的 众多 用 户 能 通过 之 间 的 协助 从 其 他 用 户 处 接收 内 
容 ， 这 种 协作 要 能 在 需要 的 时 候 (如 突 发 访问 时 ) 被 动态 触发 。 目 前 ,在 对 参与 协 
作 的 终端 用 户 的 贡献 度 的 定义 上 还 不 存在 任何 共识 ， 所 以 内 容 提 供 商 难以 执行 特定 的 
QoS 指标 。 假 设 用 户 都 是 参与 这 种 对 等 组 合 但 无 相应 补偿 的 自 利 实体 ， 那 么 它们 仅仅 
在 内 容 适 合 自 身 时 才 执 行内 容 分 发 。 

在 网 络 互联 /对 等 的 CDN 中 ， 内 容 提 供 商 租用 特定 CDN 提供 商 的 服务 来 向 终端 
用 户 分 发 内 容 ， 这 一 点 与 传统 的 CDN 相同 。 而 受 内 容 提 供 商 委托 的 CDN 提供 商 可 以 
与 其 他 的 CDN 建立 对 等 ， 以 协助 它 进 行内 容 的 分 发 ， 并 满足 它 与 内 容 提供 商 签订 的 
SLA。 对 等 CDN 的 例子 包括 IETF CDI 模型 "1 、CDN BA”), BHAA A ARS 
的 对 等 " 以 及 我 们 提出 的 对 等 CDN5 ”1 。 然 而 ,我们 认为 最 终 还 是 由 主 CDN 来 负责 
确保 QoS 指标 的 满足 ， 这 时 终端 用 户 从 某 个 内 容 提供 商 的 网 站 上 请 求 内 容 ， 而 内 容 服 
务 可 以 由 对 等 关系 中 的 任何 一 个 CDN 来 提供 。 一 个 对 等 关系 中 有 一 个 中 心 分 派 器 
(或 某 个 授权 CDN) ， 它 一 般 由 对 等 的 发 起 者 运行 和 管理 ， 负 责 将 请 求 重 定向 到 多 个 
对 等 成 员 处 。 多 CDN 之 间 的 协议 与 内 容 提供 商 和 主 CDN 之 间 的 协议 是 彼此 独立 的 ， 
因此 主 CDN 需要 负责 监控 它 所 利用 的 任何 对 等 CDN 的 性 能 ， 以 便 能 履行 对 内 容 提 供 
商 的 义务 。 


16. 5.2 基于 中 介 的 对 等 CDN 


图 16.6 中 显示 了 我 们 提出 的 两 个 模型 中 的 第 一 个 ， 用 来 协助 对 等 CDN 的 创建 。 
在 这 个 例子 中 ,“ 协 作 ” 内 容 分 发 是 由 内 容 提供 商 实现 的 ， 它 们 利用 多 个 CDN 的 服务 
来 确保 覆盖 适当 的 地 理 范围 并 同时 满足 性 能 指标 。 内 容 提供 商 有 责任 进行 高 效 的 内 容 
分 发 。 用 户 和 内 容 提 供 商 的 交互 流程 为 : 用 户 通过 在 网 络 浏览 器 中 输入 网 址 向 内 容 
提供 商 请 求 内 容 ， 用 户 请 求 直 接 传 送 到 内 容 提 供 商 的 源 服务 器 ; @ 内 容 提供 商 使 用 自 
己 的 中 介 系 统 来 选择 向 终端 用 户 分 发 内 容 的 CDN， 一 个 内 容 提供 商 能 够 选择 多 个 
CDN (基于 每 个 CDN 的 QoS 性 能 、 能 力 、 当 前 负载 以 及 所 处 地 理 位 置 等 指标 ) 向 用 
户 分 发 内 容 ， 被 选择 的 CDN 之 间 并 不 需要 知道 它们 彼此 是 并 行 工作 的 ， 因 为 责任 的 
管理 和 分 离 是 由 内 容 提供 商 来 解决 的 ，@ 达 成 一 个 内 容 提供 商 和 CDN 之 间 的 基于 策 
略 的 合作 协议 ; @ 一 旦 建立 了 对 等 关系 ， 被 选择 的 CDN 便 使 用 自己 的 专 有 算法 ， 选 
择 最 佳 的 Web 服务 器 分 发 用 户 所 请 求 的 内 容 。 

根据 上 述 模型 ， 为 了 加 入 到 对 等 组 合 中 ，CDN 提供 商 可 以 通过 彼此 竞争 来 提升 
性 能 。 内 容 提 供 商会 持续 监控 CDN 的 性 能 。 因 此 ， 内 容 提 供 商 可 以 基于 某 CDN 在 以 
往 相似 内 容 上 的 分 发 情况 来 选择 CDN， 也 可 根据 某 些 策略 向 用 户 提供 一 定 的 优惠 ， 
这 些 策略 既 可 以 是 简单 的 “ 付 多 少 费 给 多 少 服务 ”， 也 可 以 是 其 他 更 复杂 的 策略 。 


16.5.3 ”由 QoS 驱动 (定制 ) 的 基于 中 介 的 对 等 CDN 


上 面 的 模型 考虑 到 了 每 个 可 能 参与 创建 对 等 CDN 的 成 员 性 能 ， 但 并 没有 专门 考 
虑 终端 用 户 所 需要 的 QoS 指标 。 用 户 可 能 因 某 些 特殊 情况 (如 瞬时 拥塞 ) 而 具有 动 
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图 16.6 基于 中 介 的 对 等 CDN 构建 方法 


态 的 需求 ， 这 就 导致 了 “定制 ”的 内 容 分 发 。 因 此 ， 模 型 应 考虑 到 用 户 自 定义 QoS 
的 复杂 情况 ， 这 取决 于 访问 服务 的 用 户 类 型 。 因 此 ， 在 图 16. 7 中 我 们 展示 了 上 述 模 
型 的 改进 版 本 ， 以 协助 对 等 CDN 的 形成 。 在 这 个 改进 版 的 模型 中 ， 内 容 提供 商 根据 
每 个 用 户 (或 者 用 户 群 ) 的 QoS 需求 来 对 参与 者 进行 动态 选择 ， 其 交互 流程 为 : 
中 用 户 根据 特定 的 QoS 需求 从 内 容 提供 商 处 请 求 内 容 ， 请 求 到 达 内 容 提供 商 的 源 服务 
器 ; 四 内 容 提供 商 使 用 某 个 动态 算法 〈 基 于 用 户 自 定义 的 QoS) 来 选择 CDN; ON 
容 提 供 商 与 它 使 用 的 (一 个 或 多 个 ) CDN 之 间 建 立 动态 协议 来 确保 满足 用 户 的 QoS 
指标 ; @ 一 旦 与 所 选 CDN 建立 了 对 等 ， 系 统 就 从 对 等 成 员 中 的 最 优 Web 服务 器 处 分 


发 用 户 所 请 求 的 内 容 。 
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图 16.7 由 QoS 驱动 (定制 的 ) 的 基于 中 介 的 对 等 CDN 构建 方法 


这 样 的 对 等 组 合 是 针对 特定 用 户 的 ， 并 且 会 随 着 QoS 指标 、 范 围 、 大 小 和 能 力 的 
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变化 而 变化 。 内 容 提 供 商 有 责任 通过 动态 对 等 组 合 来 进行 高 效 的 内 容 分 发 。 因 此 ， 如 
果 某 个 对 等 组 合 在 分 发 内 容 时 不 能 满足 用 户 的 QoS 指标 ， 那 么 内 容 提供 商 就 会 和 
CDN 提供 商 重新 进行 必 商 来 建立 新 的 对 等 组 合 。 图 16. 7 中 显示 了 在 最 初 的 对 等 组 合 
中 ，CDN, 负责 向 用 户 分 发 内 容 。 由 于 用 户 QoS 需求 的 变化 〈 由 图 中 虚线 显示 ) ， 内 
容 提供 商 需 要 相应 地 废除 当前 的 CDN 选择 逻辑 ， 重 新 建立 一 个 新 的 对 等 组 合 。 在 新 的 
对 等 组 合 中 ，CDNw 是 一 个 新 的 参与 者 ， 它 使 用 自己 的 Web 服务 器 向 用 户 分 发 内 容 。 


16.6 ”实现 CDN 对 等 时 面临 的 挑战 


来 自 技术 和 非 技术 层面 的 挑战 (如 商业 和 法 律 上 的 ) 阻碍 了 CDN 对 等 的 快速 发 
展 ， 所 以 必须 解决 这 些 问 题 。 本 节 简 单列 举 了 CDN 对 等 面临 的 常见 问题 。 

(1) 法 律 / 版 权 问题 

被 分 发 的 内 容 通常 会 涉及 复杂 的 法 律 问题 (如 禁止 发 布 或 受 版 权 保 护 的 内 容 ) ， 
这 会 阻碍 CDN 之 间 的 自由 合作 。 当 对 等 伙伴 之 间 涉 及 内 容 传 输 时 ， 这 种 内 容 的 交互 
必须 考虑 到 与 该 内 容 相 关 的 任何 法 律 问题 。 例 如 ， 如 果 一 个 内 容 提 供 商 需要 的 软件 或 
者 文件 包含 了 某 些 政府 禁止 的 逻辑 和 内 容 ( 即 被 限制 访问 ) ， 那 么 所 有 对 等 关系 中 的 
CDN 提供 商都 要 确保 内 容 分 发 符合 相关 法 律 的 规定 。 目 前 ，CoDeeN 和 Coral 等 学 术 
CDN 都 对 提供 商 分 发 的 实际 内 容 几乎 没有 控制 ， 这 样 看 来 ， 这 些 对 等 系统 中 的 参与 
者 很 可 能 会 无 意 中 违反 法 律 规 定 。 受 版 权 保护 的 内 容 (如 出 版 物 和 数字 媒体 等 ) 特 
别 需要 仔细 管理 ， 以 确保 版 权 所 有 者 的 权益 受到 尊重 和 保护 。 某 些 CDN 的 操作 (如 
缓存 和 复制 ) 是 由 用 户 驱动 而 不 是 由 内 容 提供 商 发 起 ， 而 内 容 提 供 商 更 倾向 于 根据 
自己 的 意愿 发 布 内 容 ， 而 不 是 在 未 经 它们 同意 的 情况 下 将 其 内 容 随处 缓存 。 

(2) 遍布 全 球 

正如 前 面 章 节 所 提 到 的 ， 一 般 来 说 ，CDN 提供 商 集 中 地 管理 其 全 球 分 布 的 设施 。 
Akamai 和 Mirror Image 都 拥有 它 自己 的 全 球 性 网 络 ， 这 能 够 满足 其 绝 大 多 数 用 户 的 需 
求 。 的 确 ， 极 高 的 覆盖 面 是 这 种 大 公司 的 竞争 优势 所 在 ， 并 且 使 它们 能 够 定位 到 高 端 
客户 市 场 。 但 是 ， 很 少 有 提供 商 能 够 与 这 些 巨 头 公 司 的 全 球 影 响 力 相 比 ， 同 时 ， 这 些 
大 公司 也 缺乏 与 其 他 小 型 提供 商 建立 对 等 的 商业 或 运营 兴趣 。 

(3) CDN 市 场 的 整合 

如 果 小 型 CDN 提供 商 希 望 同 大 提供 商 在 覆盖 范围 和 性 能 方面 进行 竞争 ， 直 接 对 
等 可 能 会 给 小 提供 商 带 来 优势 。 最 近 几 年 CDN 市 场 中 有 很 多 并 购 的 情况 ， 其 结果 是 
从 20 ~30 个 提供 商 减少 到 了 5 ~ 10 个 大 型 提供 商 。 很 明显 ， 较 小 的 提供 商会 发 现 ， 
与 Akamai 5j Mirror Image 等 公司 在 覆盖 范围 和 性 能 方面 进行 竞争 非常 困难 ， 因 此 其 后 
果 往 往 是 停业 或 者 被 大 型 CDN 提供 商 收购 。 

(4) 基于 中 介 的 CDN 对 等 的 挑战 

由 内 容 提供 商 自 己 选择 多 家 CDN 进行 内 容 分 发 的 方法 无 疑 很 诱 人 ， 尤 其 是 当 这 
些 CDN 提供 商 拥有 丰富 的 资源 和 管理 技术 时 。CDN 提供 商 可 能 会 因为 它们 各 自 的 优 
点 而 被 选中 〈 如 位 置 、 性 能 、 价 格 等 ) ， 并 且 他 们 通过 联合 可 以 提供 给 客户 更 好 的 性 
能 体验 。 然 而 ， 当 同时 涉及 多 个 提供 商 时 ， 为 确保 终端 用 户 拥有 好 的 性 能 体验 而 执行 
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QoS 标准 (实质 上 是 试图 创建 一 个 鲁 棒 和 可 控 的 覆盖 网 络 ) 可 能 会 面临 各 种 各 样 的 挑 
战 ， 尤 其 是 当 这 些 CDN 实际 上 并 没有 协作 关系 ， 而 只 是 简单 地 进行 并 行 化 运转 时 。 

(5) 基于 P2P 的 CDN 对 等 的 挑战 

最 近 十 年 ， 利 用 用 户 的 带宽 ， 以 P2P 方式 协作 分 发 内 容 变 得 越 来 越 流行 。 尽 管 
起 初 这 是 违背 内 容 提供 商 意 愿 的 (如 Napster, Gnutella 等 ) ， 但 最 终 内 容 提 供 商 还 是 
接受 了 POP 技术 ,特别 是 BitTorent。 这 主要 是 为 了 分 发 大 量 的 可 扩展 性 内 容 ， 其 性 
能 要 远 超过 传统 的 分 布 式 CDN。 内 容 提 供 商 已 经 有 效 地 利用 BitTorrent 来 发 布 数字 媒 
ik (HEMER), PERA (如 Linux) 和 操作 系统 补丁 、 游 戏 和 游戏 补丁 等 。 随 
着 高 速 带 宽 的 普及 ,终端 用 户 带宽 也 得 到 了 提高 ， 用 户 在 下 载 的 同时 上 传 一 部 分 数 
据 ， 内 容 提供 商 可 以 借 此 对 用 户 进行 平衡 。 然 而 ， 这 种 方法 只 对 那些 访问 量 很 大 的 文 
件 有 效 ， 而 且 由 于 某 些 文件 并 不 会 被 足够 多 的 用 户 制作 “种 子 ”， 因 而 会 导致 较 差 的 
用 户 体验 。 因 此 ， 当 发 布 内 容 的 节点 简单 地 是 终端 用 户 时 ， 内 容 提供 商 很 难保 证 任何 
特定 的 QoS 指标 下 限 ， 因 为 一 旦 终端 用 户 接收 完 数据 内 容 ， 它 们 可 能 就 没有 什么 继续 
合作 下 去 的 动力 了 。 

(6) 缺乏 对 协作 的 激励 机 制 

来 自 于 互联 网 服务 提供 商 (ISP) 的 强烈 抵制 ， 使 得 对 等 方法 的 前 途 更 加 不 确 
Eo IP 并 不 希望 内 容 提供 商 将 内 容 分 发 的 负担 和 成 本 转移 到 终端 用 户 身 上 ， 因 为 最 
终 还 是 会 落 到 ISP 自己 头 上 。 针 对 这 一 状况 ,许多 ISP 正 积 极 阻止 和 限制 BitTorrent 和 
其 他 POP 流量 ,通过 抑制 其 扩张 来 避免 自身 收入 的 缩水 ， 以 及 减少 ISP 由 此 产生 的 配 
置 额 外 设施 的 成 本 。 许 多 在 地 理 位 置 分 布 上 比较 孤立 的 国家 (在 所 谓 的 边缘 上 ) ， 如 
澳大利亚 和 新 西 兰 ， 其 ISP 属于 特殊 的 情况 ， 它 们 只 能 依赖 少量 的 昂贵 连接 与 北美 和 
欧洲 的 网 络 互联 。 因 此 ， 这 些 地 区 的 ISP 所 提供 的 宽带 接 入 有 固定 的 数据 额度 (而 不 
是 无 限 的 ) ， 终 端 用 户 是 受 限 的 ， 这 保证 了 ISP 仍然 有 利 可 图 。 这 些 情况 进一步 阻碍 
了 终端 用 户 参 与 内 容 分 发 的 协作 ， 同 时 也 不 利于 在 内 容 发 布 中 广泛 采用 协作 的 方式 。 


16.7 对 等 CDN 的 技术 问题 


对 等 CDN 的 部 署 存 在 独特 的 研究 课题 。 在 这 一 节 中 ， 介绍 部 署 对 等 CDN 将 要 面 
临 的 一 系列 问题 。 虽 然 针对 CDN 领域 的 相关 问题 存在 一 些 解 决 方案 , 但 CDN 网 络 互 
联 /对 等 的 概念 带 来 了 额外 的 挑战 。 因此， 为 了 给 出 下 一 步 的 研究 方向 ,重点 介绍 与 
实现 CDN 对 等 有 关 的 关键 问题 。 

1. 对 等 CDN 的 负载 分 配 

对 等 CDN 的 负载 分 配 策略 包括 请 求 分 配 与 重 定向 、 负 载 传播 (load dissemina- 
tion) 以 及 内 容 复 制 。 而 如 何 协调 这 些 核 心 内 容 是 负载 分 配 策略 成 功 与 否 的 另 一 个 重 
要 考虑 因素 。 

对 等 中 的 Web 服务 器 在 地 理 上 分 布 于 各 处 ， 为 了 将 请 求 重 定向 和 分 配 到 这 些 服 
务 器 ， 负 载 分 配 策略 除了 需要 考虑 任务 的 大 小 〈 如 内 容 请 求 的 处 理 要 求 ) 之 外 ,还 
需要 考虑 终端 用 户 的 位 置 、 服 务 器 负载 以 及 终端 用 户 和 服务 器 之 间 的 连接 利用 率 。 不 
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仅 如 此 ， 它 还 要 能 够 应 对 动态 变化 的 情况 ， 如 瞬时 拥塞 以 及 其 他 不 可 预测 的 事件 。 除 
此 之 外 ， 请 求 的 分 配 和 重 定向 还 要 能 够 运行 于 CDN 的 多 个 层面 上 ， 如 DNS、 本 地 服 
务 器 集群 的 网 关 以 及 集群 内 的 服务 器 之 间 ” 。 商 业 CDN 主要 依靠 在 DNS 层面 使 用 
一 个 基本 的 请 求 分 配 策 略 (如 加 权 轮 转 或 最 小 负载 优先 ) 来 实现 对 终端 用 户 的 分 配 ， 
以 便 通 过 更 新 DNS 的 记录 来 指向 最 适合 的 副本 服务 器 。 在 对 等 CDN 中 ， 可 以 通过 
DNS 来 分 配 终端 用 户 (通过 参与 CDN 的 对 等 代理 来 定期 更 新 它们 的 DNS 记录 ) ， 以 
及 在 恰当 的 时 候 通 过 CDN 网 关 (也 就 是 作为 一 个 单一 实体 的 调解 器 、PA 和 策略 库 ) 
进行 重 定向 。 

为 了 处 理 负载 传播 问题 ， 可 以 使 用 峰值 负载 对 流量 进行 建 模 ， 因 为 在 这 种 情况 下 
服务 器 的 负载 能 力 会 面临 最 严峻 的 考验 。 负 载 信 息 的 测量 和 传播 可 以 在 单个 CDN 和 
其 他 的 CDN 之 间 进 行 。 一 个 负载 指标 可 以 用 于 测量 计算 机 系统 中 单一 资源 的 使 用 量 。 
或 者 ， 它 可 以 对 多 类 资源 进行 综合 测量 ， 如 CPU 负载 、 内 存 使 用 率 、 磁 盘 分 页 和 活 
动 的 进程 等 。 这 些 负 载 信息 需要 在 所 有 参与 的 CDN 中 及 时 、 高 效 地 传播 ， 以 最 大 限 
度 地 发 挥 它 的 作用 。 这 些 指标 可 以 用 来 识别 一 些 重要 的 情况 ， 如 正确 建立 CDN 对 等 
组 合 的 条 件 (如 当 服 务 器 或 整个 CDN 网 络 过 载 ) 或 判断 何 时 CDN 的 资源 利用 率 不 足 
而 可 以 将 之 提供 给 其 他 CDN 提供 商 使 用 。 对 此 ， 可 以 设想 一 种 分 层 化 的 方法 ，CDN 
中 Web 服务 器 的 当前 网 络 带宽 和 资源 使 用 情况 会 以 定期 或 基于 阔 值 的 方式 向 CDN 网 
关 报 告 ， 然 后 各 相关 CDN 网 关 各 自 汇 总 其 负载 信息 ， 而 这 些 负载 信息 用 于 描述 其 组 
内 服务 器 成 员 的 负载 状况 。 

在 CDN 内 部 ， 内 容 复 制 在 源 服务 器 及 其 他 服务 器 中 进行 。 现 有 CDN 提供 商 〈 如 
Akamai, Mirror Image 等 ) 使 用 非 协 作 的 基于 推送 的 方式 ， 其 中 请 求 直接 (通过 
DNS) 定向 到 最 近 的 副本 服务 器 "" 。 如 果 请 求 的 文件 没有 存储 在 那里 ， 则 副本 服务 
器 从 源 服 务 器 获取 内 容 。 学 术 界 已 经 提出 了 协作 的 基于 推送 的 技术 ， 它 使 用 一 个 贪 楚 
全 局 启发 式 算法 所 将 内 容 推送 到 参与 的 CDN 镜像 服务 器 中 。 在 这 种 方法 中 ， 请 求 被 
直接 定向 到 最 近 的 镜像 服务 器 ， 或 者 如 果 附 近 没 有 合适 的 镜像 服务 器 ， 请 求 就 被 定向 
到 源 服 务 器 。 在 对 等 CDN 中 ， 这 种 复制 手段 延伸 到 参与 其 中 的 其 他 CDN 服务 器 ， 促 
进 了 服务 器 之 间 可 用 资源 的 共享 。 

总 之 ， 对 等 CDN 之 间 分 配 负载 需要 解决 以 下 问题 : 

1) 如 何 产生 一 个 动态 请 求 分 配 和 重 定向 策略 用 于 计算 系统 运行 过 程 中 请 求 路 由 
的 理想 参数 ? 

2) 如 何 才 能 确保 减少 服务 器 负载 、 减 少 带 宽 消耗 (由 特定 的 CDN 服务 器 消耗 ) 
以 及 提高 内 容 分 发 的 性 能 ? 

3) 参与 的 CDN 如 何 通过 协作 来 复制 内 容 ， 以 便 为 所 有 的 参与 各 方 提供 满意 的 解 
决 方案 ? 

4) 采取 什么 措施 来 确保 缓存 对 象 不 过 期 ? 如 何 处 理 不 能 缓存 的 对 象 ? 

2. CDN 的 协调 

上 述 负载 分 配 的 核心 技术 问题 的 任何 解决 方案 都 必须 在 对 等 组 合 的 所 有 参与 者 之 
间 进 行 协调 ， 这 样 才能 提供 高 性 能 和 用 户 满意 的 QoS。 因 此， 必须 开发 一 种 用 于 协作 
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的 中 间 件 来 确保 解决 方案 能 正确 执行 ， 以 解决 这 些 核心 问题 。 为 此 ， 需 要 解决 的 主要 问 
题 是 : 需要 采取 哪 种 协调 机 制 才能 确保 有 效 性 ， 并 且 使 得 对 等 CDN 能 够 发 展 和 可 扩展 ? 

3. 服务 和 策略 的 管理 

在 对 等 CDN 中 ， 应 该 根据 用 户 的 偏好 进行 内 容 管理 。 因 此 ， 一 个 管理 分 布 式 内 
容 的 综合 模型 必须 要 考虑 到 用 户 的 偏好 。 为 了 解决 这 个 问题 ， 可 以 对 内 容 进 行 个 性 化 
处 理 来 满足 特定 用 户 (或 者 用 户 群 ) 的 喜好 。 例 如 ， 在 一 些 个 性 化 的 网 站 中 ,， 使 用 
数据 挖掘 技术 从 内 容 请 求 和 相关 数据 中 自动 获得 用 户 的 兴趣 所 在 5 。 在 CDN 中 ,可 
以 通过 对 流量 、 定 价 以 及 记 账 等 事务 的 正确 管理 ， 利 用 数据 挖掘 技 术 使 性 能 得 到 显著 
的 提高 。 在 这 方面 ， 需 要 解决 以 下 问题 ; 

1) 如 何在 用 户 可 以 访问 的 设施 服务 中 添加 增值 服务 ? 

2) 参与 各 方 需要 协商 什么 类 型 的 SLA? 要 生成 什么 策略 来 支持 SLA 协商 ? 

3) 如 何 能 够 及 时 地 启动 自主 策略 协商 来 支持 一 个 具有 时 间 敏 感性 的 对 等 组 合 ? 

4. CDN 中 内 容 和 服务 定价 

为 了 实现 对 等 CDN 参与 者 之 间 持 续 分 享 资源 ， 必 须 确保 所 有 参与 各 方 都 有 足够 的 激 
励 存 在 ， 这 就 需要 配置 正确 的 价格 、 付 费 和 管理 系统 。 这 一 方面 要 解决 的 主要 问题 是 : 

1) 在 价值 表达 (内 容 和 服务 需求 的 表达 和 估 值 ) 、 价 值 转换 (将 需求 转移 到 内 
容 和 服务 分 发 中 ) 以 及 价值 实施 (不 同 内 容 和 服务 的 选择 和 分 布 的 实施 机 制 ) 这 几 
个 方面 需要 使 用 什么 机 制 ? 

2) 在 竞争 环境 中 CDN 提供 商 如 何在 保持 供求 平衡 的 同时 达到 收益 最 大 化 ? 


16.8 结论 


目前 内 容 网 络 和 内 容 联 网 技术 的 发 展 趋 势 已 经 引起 了 人 们 对 CDN 网 络 互联 的 兴 
趣 。 找 到 不 同 CDN 与 其 他 内 容 网 络 之 间 协 调 、 合 作 的 方式 ， 对 于 实现 更 好 、 更 全 面 
的 服务 至 关 重 要 。 在 本 章 中 ， 我 们 提出 了 CDN 网 络 互联 的 一 种 方法 ， 它 致力 于 在 
CDN 的 服务 需求 和 由 于 部 署 特 定 客 户 所 带 来 的 高 运营 成 本 以 及 因此 造成 的 资源 过 度 
配置 等 情况 之 间 做 出 平衡 。 在 我 们 所 提出 的 方法 中 ，CDN 的 可 扩展 性 和 CDN 之 间 的 
资源 共享 可 以 通过 对 等 技术 得 到 性 能 提升 ， 这 就 为 CDN 的 发 展开 辟 了 全 新 的 视角 。 
这 一 章 中 ， 我 们 还 提出 了 两 个 新 的 模型 来 支持 CDN 对 等 技术 ,并 指出 了 相关 的 研究 
挑战 。 实 现 CDN 对 等 的 概念 ， 将 成 为 对 发 展 中 的 内 容 网 络 的 一 个 重要 贡献 。 
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